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|. Het patroonherkennend systeem en enkele hierin toepasbare 


technieken 


door ir. R. P. W. Duin, Laboratorium voor Technische Natuurkunde, T.H. Delft 


Synopsis: The Pattern Recognition System and some General Applicuble Techniques. 
The pattern recognition system is considered as a system that can classify into known classes those objects, 
which are physically observable phenomena. Only the case is discussed in which the classes can be defined by 


objects of known classification. 


A model for classifving systems is given. This model consists of three parts: a transducer, which performs 
measurements on the objects, a pre-processor, which selects features from the measurements with the help of 
‘a priori’ knowledge and heuristic algorithms. and a decision unit, which classifies the objects according to the 


features. 


Some techniques for the construction of pre-processors and decision units are discussed. Finally some appli- 


cations and a brief prospect are given. 


|. Inleiding 


Er bestaat in het gebied van patroonherkennen een grote varië- 
teit aan problemen, technieken en toepassingen. We zullen ons 
in dit artikel tot enkele algemene aspecten beperken. Enkele 
deelgebieden, die soms wel tot patroonherkennen worden ge- 
rekend, zullen buiten beschouwing blijven. Hiertoe behoort o.a. 
het herkenningsmechanisme in biologische systemen. Alleen 
kunstmatige systemen zullen worden bekeken. Door Nagy 
(1968) is een overzicht van vele problemen en technieken ge- 
geven [9]. 

Het ingangssignaal van een patroonherkennend systeem 
wordt in het algemeen gevormd door een aantal metingen aan 
objecten. Objecten zijn fysisch waarneembare grootheden (bijv. 
‘signalen’ als gesproken woord en elektrocardiogrammen, of 
‘beelden’ als cijfers en auto’s). Het uitgangssignaal bestaat uit 
een classificatie van het aangeboden object. Deze classificatie 
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is een uitspraak omtrent het al dan niet behoren tot een be- 
paalde klasse van objecten. Het is mogelijk om m.b.v. dit 
systeem andere systemen te regelen. Er kan dan sprake zijn 
van zogenaamd lerend regelen (learning control). Dergelijke 
aspecten van patroonherkennen zullen niet in beschouwing 
worden genomen. Overzichtsartikelen op dit gebied zijn ge- 
publiceerd door Sklansky (1966) [12] en Fu (1970) [4]. 

De klassen waarin objecten worden verdeeld kunnen op drie 
manieren worden gedefinieerd : 


a. Door het systeem zelf. Op grond van de aangeboden objecten 
gaat het systeem klassen onderscheiden. Het is mogelijk dat 
het voortdurend blijft leren, dus dat het, wanneer daar aan- 
leiding toe is, de klassenindeling wijzigt. Vaak wordt het ech- 
ter in dezelfde toestand gehouden als het na een zekere leer- 
periode bevredigend werkt. Aangetekend moet nog worden 
dat het bij het ontwerpen van het systeem vaak noodzakelijk 
is om voorkennis omtrent de objecten te gebruiken. 

We zullen de systemen van deze groep verder buiten be- 
schouwing laten. Ze zijn o.a. beschreven door Patrick (1968) [11] 
en Cooper (1969) [2]. 
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b. Mer behulp van leerobjecten. Van elke der te onderscheiden 
klassen wordt een aantal objecten met bekende classificatie 
(gelabelde objecten) gebruikt om het systeem te ontwerpen en 
zodanig in te stellen dat de klassen zo goed mogelijk worden 
onderscheiden. Na deze leerfase kan het systeem operationeel 
worden. Er vinden dan geen wijzigingen meer in plaats. 


c. Met behulp van vooraf bepaalde, meetbare criteria. In dit 
geval is precies bekend waaraan de metingen aan de objecten 
van de diverse klassen behoren te voldoen. We zullen derge- 
lijke gevallen, die zich slecht lenen voor algemene beschouwin- 
gen, verder niet in aanmerking nemen. 


We beperken ons verder tot het onder b. genoemde geval, 
waarbij de klassen dus impliciet door een aantal gelabelde 
objecten worden gedefinieerd. 


2. Het patroonherkennend systeem 


Het totale classificatieproces kan worden beschreven als een 
vorm van intormatiereductie. Uitgaande van alle gegevens die 
van een object zijn te bepalen blijft uiteindelijk alleen de clas- 
sificatie over. Er zijn drie methoden om deze informatiereductie 
te bewerkstelligen: 


a. Mer behulp van a priori kennis. Door gebruik te maken van 
kennis die men van objecten en klassen heeft, kunnen metingen 
en combinaties van metingen worden geselecteerd die vermoe- 
delijk relevant zijn voor de classificatie. 


b. Met behulp van een statistische analyse van de leerobjecten. 


c. Met heuristische methoden. Hierbij wordt vaak weer gebruik 
gemaakt van statistische gegevens en a priori kennis. 

De resultaten van de laatste twee methoden zijn in het alge- 
meen beter wanneer het aantal parameters kleiner is. Het ver- 
dient daarom aanbeveling om in eerste instantie zoveel mogelijk 
van de a priori kennis gebruik te maken. 

Op grond hiervan is het in fig. l geschetste model voor het 
patroonherkennend systeem opgesteld. De ‘opnemer’ meet die 
gegevens aan het object waarvan vermoed wordt, dat ze rele- 
vant zijn. Op grond van a priori kennis. en soms met behulp 
van heuristische methoden wordt een ‘bewerker’ geconstrueerd 
die zoveel mogelijk niet-relevante informatie elimineert. Het 
uitgangssignaal van de bewerker bestaat uit zen. kenmerken. 
Dit zijn combinaties en transformaties van metingen, waarin 
de relevante informatie zoveel mogelijk is geconcentreerd. Tot 
slot wordt m.b.v. kenmerken de beslissing genomen omtrent 
de classificatie. 

Een voordeel van een dergelijk model is dat bij de constructie 
van de ‘beslisser’ geen gebruik gemaakt behoeft te worden van 


kenmerken 


metingen 


klassen 


beslisser H 


Fig. 1. Een model voor het patroonherkennend systeem. 
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a priori kennis over de objecten waarvoor het systeem wordt 
opgezet. Hierdoor is het mogelijk beslissers in het algemeen te 
bestuderen. In zo’n algemene beslisser komen vaak nog een 
aantal parameters voor. Deze kunnen m.b.v. de leerobjecten 
worden ingesteld. 

Wanneer het systeem eenmaal is geconstrueerd kan het wor- 
den getest met een aantal gelabelde objecten. Dit dienen uiter- 
aard andere dan de leerobjecten te zijn. Wanneer de werking 
niet bevredigend is, kan worden geprobeerd meer leerobjecten 
te nemen. Hierdoor kan een beter gebruik gemaakt worden van 
statistische gegevens. Een andere mogelijkheid is een nadere 
studie van de objecten en de klassen te maken. De a priori 
kennis wordt hierdoor vergroot, zodat wellicht een betere be- 
werker kan worden gemaakt. Het gegeven model met een bewer- 
ker en een beslisser zal niet voor alle patroonherkennende 
systemen voldoen. Soms is de beslisser praktisch verdwenen 
en wordt alles met behulp van de a priori kennis opgelost. Dit 
is onder meer het geval bij systemen die een duidelijke simu- 
latie van het menselijk beslissingsproces in een specifiek geval 
vormen. 


De functies en de mogelijkheden van de bewerker en de beslis- 
ser zullen in het nu volgende wat verder worden uitgewerkt. 


3, De bewerker 


De bewerker heeft twee taken. Allereerst dient hij zo veel 
mogelijk van de niet-relevante informatie in het opnemersig- 
naal te elimineremr. Bovendien moet de informatie in de vorm 
van voor de beslisser geschikte kenmerken worden afgegeven. 
Gezien het voorgaande dient het aantal kenmerken zo klein 
mogelijk te zijn. De kenmerken kunnen van kwantitatieve aard 
Zijn, zoals bijvoorbeeld continu variabele parameters, of van 
kwalitatieve aard, zoals het al dan niet aanwezig zijn van een 
bepaalde eigenschap. Een en ander legt uiteraard eisen op aan 
de beslisser. 

Algemene methoden voor het bepalen van kenmerken uit 
een aantal meetgegevens zijn er vrijwel nog niet. Voor bepaalde 
typen objecten, zoals eenvoudige tweedimensionale figuren, be- 
staan er wel een aantal standaardtechnieken, zie Levine (1969) 
[8]. We zullen nu enige mogelijkheden noemen, volgens welke 
relevante kenmerken kunnen worden opgespoord. 


a. Op heuristische gronden kunnen metingen worden geselecteerd, 
gecombineerd en getransformeerd. Hierbij wordt gebruik ge- 
maakt van de beschikbare a priori kennis van de objecten. 
Voorbeelden zijn het zoeken van eindpunten, drie- en vier- 
sprongen e.d. bij het herkennen van schrift, of de bepaling van 
hoogte en lengte bij het onderscheiden van vrachtauto’s en 
personenauto's, Wanneer er aanleiding toe is kunnen ook 
fouriertransformaties en polynoombenaderingen van signalen 
worden geprobeerd. 


b. Het genereren en proberen van combinaties van metingen. In 
sommige gevallen, bijv. wanneer het aantal mogelijke combi- 
naties niet te groot is, kan het zin hebben om alle, of een aan- 
tal combinaties te proberen. Ook is het mogelijk om volgens 
een op heuristische gronden geconstrueerd patroon combina- 
ties te genereren en te proberen. Dit is o.a. beschreven door 
Bakis, Herbst en Nagy (1968) [I]. Het nagaan van de aan- 
wezigheid van correlaties tussen metingen is van belang bij het 
zoeken naar geschikte combinaties. 
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c. Clusteranalvse, Is eenmaal een aantal kenmerken geselec- 
teerd, dan kan worden nagegaan in hoeverre er op grond van 
deze kenmerken structuur binnen een klasse aanwezig is. Wan- 
neer namelijk blijkt dat een klasse duidelijk in een aantal 
subklassen uiteenvalt, kan het voordelen hebben elk van 
de subklassen afzonderlijk te beschouwen in plaats van de 
totale klasse. Er zijn echter nog geen methoden bekend die 
met grote hoeveelheden data in alle opzichten bevredigend 
werken. 


d. Dimensieanalyse. Hieronder wordt verstaan het onderzoek 
naar het aantal dimensies dat wezenlijk van belang is bij de 
beschrijving van een groep objecten. Wanneer alle objecten 
in een, eventueel niet-lineaire, deelruimte van de kenmerk- 
ruimte (zie par. 4) zouden blijken te liggen, heeft het zin te 
zoeken naar de kenmerken die deze deelruimte beschrijven. 
Hierdoor wordt een kenmerkreductie bereikt. 


Een probleem bij het bepalen van geschikte kenmerken is dat 
het meestal niet mogelijk is een kenmerk afzonderlijk op zijn 
waarde te toetsen. Dit komt doordat de kenmerken In de be- 
slisser samenwerken. Hierdoor is het mogelijk dat kenmerken 
samen betere resultaten leveren dan op grond van de resul- 
taten van de kenmerken afzonderlijk zou worden verwacht. 
Zie bijv. fig. 2, waar vanwege de correlatie tussen de ken- 
merken een betere scheiding mogelijk is dan uit de kenmerken 
afzonderlijk zou blijken. Uitsluitend in het geval, waarin de 
kenmerken ongecorreleerd zijn, heeft het zin ze afzonderlijk 
op hun bruikbaarheid te toetsen. 

Een eritertum hiervoor, wanneer scheiding van twee klassen 
wordt beoogd, is het criterium van Fisher: 


(HM Hi) 


en Ph 
ME 


waarin voor het onderzochte kenmerk ‚en u, de gemiddelde 
waarden en aj en 5; de varianties van de beide klassen zijn. 

Een grote waarde van L duidt op een grote scheidbaarheid, 
Dit is echter alleen zinvol als de beslisser een lineaire scheidings- 
functie (zie par. 4) instelt. In kwadratisch scheidbare situaties 
kan de waarde van L toch nul worden, hoewel dit zou duiden 
op zeer slechte scheidbaarheid. 

Wanneer men de beschikking heeft over een vast aantal leer- 
objecten waaraan in principe zeer veel verschillende metingen 
gedaan kunnen worden, is het gevaarlijk om al deze metingen 


me kenmerk 2 


ee kenmerk Ì 


Fig. 2. Voorbeeld van de ligging van twee klassen waarbij de ken- 
merken afzonderlijk verkeerd zouden kunnen worden gewaardeerd 
ten gevolge van de correlatie tussen: de kenmerken. Wanneer in dit 
geval alleen op kenmerk 2 zou worden gelet zou men ten onrechte 
kunnen menen dat de bijdrage van dit kenmerk nihil is. 
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id 


aantal kenmerken 


Fig. 3. Verloop van de kans op foutclassificaties R als functie van 
het aantal kenmerken bij een constant aantal leerobjecten. 


maar als kenmerken te gebruiken. In fig. 3 ís het verloop 
geschetst van de fouten, die met een gevonden scheidingsfunctie 
uiteindelijk kunnen worden gemaakt, als functie van het ge- 
bruikte aantal kenmerken, en bij een vast aantal leerobjecten. 
Bij toeneming van het aantal kenmerken zullen de resultaten 
eerst verbeteren, maar uiteindelijk verslechteren. Dit geldt 
overigens alleen wanneer de nieuw toegevoegde kenmerken 
niet beter zijn dan de reeds bestaande. De oorzaak hiervan is 
waarschijnlijk dat het aantal gegevens op grond waarvan de 
beslisser wordt ingesteld, lineair toeneemt met het aantal ken- 
merken. Deze gegevens zijn de kengetallen van alle leerobjecten. 
De grootte van de kenmerkruimte, waarin de beslissing uit- 
eindelijk moet worden genomen, stijgt echter met de macht van 
het aantal kenmerken. 


4. De beslisser 


Bij de behandeling van de beslisser zullen wij ons twee be- 
perkingen opleggen. Wij zullen alleen het geval behandelen 
waarin onderscheid wordt gemaakt tussen slechts twee klassen. 
en bovendien aannemen dat de kenmerken continu variabel 
zijn. Wanneer ze discreet of binair zijn zal een aantal genoemde 
methoden toch. zij het na enige modificatie, bruikbaar zijn. 
In het geval dat de kenmerken kwalitatief van aard zijn wordt 
evenwel een geheel andere aanpak dan de behandelde vereist. 

We zullen de ingang van de beslisser, de verzameling van 
kenmerken. voorstellen door een vector x. Door de kenmerken 
wordt een zgn. kenmerkruimte opgespannen. De leerobjecten 
van de klassen A en B worden voorgesteld door vectoren ín 
deze ruimte. Bt = 1,2,... Jr) resp. Xa, (f = 1,2,...,n). De 
beslissing omtrent de classificatie van een object x wordt ge- 
nomen m.b.v. een scheidingsfunctie F(x), en wel volgens (zie 
fig. 4): 


Fix) = 0 
Fix) = 0 


X, uit klasse A 

x, uit klasse A of B 

Fix) <0 x, uit klasse B 

Wij zullen twee typen methoden onderscheiden om F(x) te vin- 
den, nl. de statistische methoden en de heuristische methoden. 
Al. Statistische methoden 


Deze methoden berusten op de strategie dat F(x) zodanig moet 
worden bepaald dat, wanneer ermee wordt geclassificeerd, de 
kosten veroorzaakt door optredende foutclassificaties minimaal 
zijn. Wanneer voor de objecten uit klasse A een kansdichtheids- 


ET 131 


klasse À Eixi=0 


Flal=0 


Flal =0 


me kenmerk 2 
0 


X klasse B 


kenmerk | 


Fig. 4. Voorbeeld van een scheidingsfunctie in de kenmerkruimte. 


verdeling P‚(x) en voor de objecten uit klasse B een kans- 
dichtheidsverdeling P‚(x) geldt, dan zijn de kosten die bij ge- 
bruik van F(x) worden gemaakt: 


PENUE + Af Fata (1 


EN " 
Pimjen Bi aje 


Hierin zijn h‚ en h, de a priori waarschijnlijkheden van het 
voorkomen van objecten uit resp. klasse A en B, en /, en /, 
de kosten die verbonden zijn aan een foutclassificatie van een 
object van klasse A resp. B. Vrij eenvoudig is te bewijzen dat (1) 
minimaal is als: 


Flx) e= kr, (x) En AtPs (x) (2) 


De statistische methoden zijn gebaseerd op het schatten van 
de kansdichtheidsverdelingen m.b.v. de leerobjecten, waarna 
uit (2) F(x) volgt. Het schatten van P‚(x)en P(x) kan op twee 
manieren gebeuren: 

a. Parametrisch. Aangenomen wordt dat de verdelingen van 
een bekend type zijn. Met behulp van de leerobjecten worden 
nu de parameters van de verdelingen geschat. In het geval van 
een normale verdeling zijn dit bijvoorbeeld de covariantiematrix 
en het gemiddelde. 

b. Non-parametrisch, Een andere manier om de verdelingen 
Pla) en P‚(x) uit de leerobjecten te schatten is ieder leer- 
object vervangen te denken door een potentiaalfunctie db (x) 
en vervolgens over de leerobjecten te sommeren: 


| nn 

Pla Nx &) 
ren 

: 1 5 

Po) d (A) 
Mr À 


Bekende keuzen voor @ zijn: 


5) er 
exp En 
25° ly xx 


Door Specht (1966) [13] is een methode ontwikkeld. die op de 
eerstgenoemde functie is gebaseerd. 


42. Heuristische methoden 

Tussen de diverse methoden uit deze groep bestaat weinig 
samenhang. 

42.1. Minimalisering van het aantal foutgeclussificeerde leer- 
objecten. 

Hierbij wordt voor F(x) een bepaalde vorm gekozen, bijv. 
F(x) = w.Xx + w. De parameters w en w‚ dienen nu zo te 
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worden bepaald, dat het classificatieresultaat van de leerobjecten 
met F(x) zo goed mogelijk is. Het optimaliseren van F(x) kan 
gebeuren door alle leerobjecten tegelijk in aanmerking te nemen 
(simultane methoden), of door de classificaties van de leer- 
objecten stuk voor stuk te bekijken en aan de hand hiervan 
eventueel correcties aan F(x) aan te brengen (sequentiële me- 
thoden). 


a. Simultane methoden. Voor F(x) moet nu gelden dat de leer- 
objecten zo goed mogelijk worden geclassificeerd, dus dat: 


eri - | m ' n 
dwarf (Fix, )) + =d wef (-Flx,)) 
PIE, ANTI 


dek 


minimaal is. Hierin is wef(F(x,)) een weegfunctie van het 
classificatieresultaat van het leerobject XX. Wanneer F(x) een 
genormeerde functie is wordt mm feite de afstand van Nu tet 
het scheidingsvlak F(x) = 0 gewogen. De meest voor de hand 
liggende weegfunctie is de stapfunctie: 


waf(y) = 0 voor y 2 0 


wgt(y) = 1 voory <= 0 


Hierdoor wordt het aantal foutgeclassificeerde leerobjecten ge- 
minimaltseerd. Om het minimaliseringsproces wat makkelijker 
te laten verlopen worden vaak continu verlopende functies ge- 
bruikt. Problemen die optreden zijn de keuze van de weegfunctie 
wgf en het minimaliseringsproces. Aangetoond kan worden dat 
voor sommige weegfuncties deze methode dezelfde is als de 
eerder genoemde non-parametrische statistische methode met 
hl, = Anale 


b. Sequentiële methoden. Met de classificatie van elk leerobject 
afzonderlijk wordt de scheidingsfunctie F(x) via w en w‚ bij- 
gewerkt. De correctie is in het algemeen een functie van het 
classificatieresultaat, van de gewenste classificatie van het be- 
treffende leerobject x,. en van F(x). Er bestaat een grote variëteit 
aan methoden op dit gebied, waarvan sommige convergentie 
garanderen en andere niet. Het belang van deze methoden is 
dat ze relatief eenvoudig zijn te instrumenteren, daar ze geen 
snel toegankelijke geheugens voor de leerobjecten vereisen. 
Adaline (adaptive linear element) en FLU (threshold Anear unit) 
zijn benamingen voor apparaten die volgens een sequentiële 
methode werken, zie Nilsson (1965) [10]. 


422. Methode van de convex omhullende 

Van de leerobjecten der beide klassen A en B wordt de convex 
omhullende bepaald. Hiermee wordt de ruimte in vier gebieden 
verdeeld, nl. een gebied dat tot klasse A hoort, een gebied dat 
tot klasse B hoort, een gebied dat tot beide klassen hoort en 
een gebied dat tot geen van beide klassen hoort. Hiermee kun- 
nen objecten worden ingedeeld. Vallen ze buiten de beide klas- 
sen, of in het overlappingsgebied, dan kan een willekeurige 
keuze worden gedaan, of niet-automatisch worden ingedeeld. 


423. De naaste-buurmethode 

Hierbij wordt een object toegewezen aan de klasse van het leer- 
object dat de kleinste afstand tot het aangeboden object heeft. 
De praktische bruikbaarheid van deze methode is gering, daar 
het noodzakelijk is om voor elk aangeboden object de afstanden 
tot alle leerobjecten te berekenen. Het belang van deze methode 
is echter dat zij een indruk geeft over de best mogelijke scheiding. 
zie bijv. Cover en Hart (1967) [3]. 

424. De sjabloonmethode 

Bij deze methode wordt van een aangeboden signaal de signaal- 
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vorm of een codering daarvan vergeleken met de vormen of 
codes van enige referentiesignalen die typische voorbeelden zijn 
van de te onderscheiden klassen. De meeste werkende cijfer- 
herkennende systemen berusten op deze methode. 


Door Ho en Agrawala (1968) [5] is een uitgebreid overzicht ge- 
geven van een aantal classificatiemethoden. Het geval dat de 
objecten worden gerepresenteerd door kwalitatieve kenmerken 
is tot nu toe buiten beschouwing gebleven. Meestal wordt m.b.v. 
a priori kennis een zgn. beslissingsboom gemaakt. waarbij de 
kenmerken sequentieel worden bekeken. Er zijn methoden die 
automatisch m.b.v. leerobjecten een dergelijke beslissingsboom 
kunnen leveren. Dit is o.a. beschreven door Hunt (1966) [6]. 


S. Toepassingsgebieden 


De meeste toepassingen van patroonherkennen worden gevon- 
den in gebieden waar men een menselijke herkenner wil stmu- 
leren vanwege het routinematig karakter van zijn werk, of van- 
wege het feit dat men pas na automatisering van het herkennings- 
proces in staat is om complexe of massale hoeveelheden ge- 
gevens te verwerken. De volgende toepassingsgebieden vallen 
onder meer te onderscheiden: 

e Medische en biologische toepassingen. Het stellen van dia- 
gnoses uit meetgegevens, zoals elektrocardiogrammen en elek- 
troëncefalogrammen. Het analyseren van cellen en chromo- 
somen ten einde afwijkingen te kunnen vaststellen. 

e Automatische persoonsidentificatie aan de hand van bijv. 
vingerafdruk, handschrift, spraak of het gelaat. 

se Communicatie tussen mens en machine met behulp van ge- 
sproken en geschreven woord. Hieronder valt o.a. het auto- 
matisch lezen van letters en cijfers, met onder meer als doel 
het toegankelijk maken van bestaande archieven. 

e Het verwerken van luchtfoto's t.b.v. luchtkartering, weers- 
voorspelling, militaire toepassingen, e.d. 


Naast deze gebieden zijn er nog toepassingen als het herkennen 
van bellenvatloto's, het interpreteren van chemische analyses en 
het herkennen van diverse spectra, signaalvormen, e.d. 


6. Vooruitzichten 


De geschetste aanpak van het automatisch patroonherkennen 
komt er op neer dat zo ver als mogelijk is de menselijke kennis 
van de objecten wordt gebruikt. Op het punt dat deze tekort 
schiet, of moeilijk exact kan worden weergegeven. wordt de 
hulp van de statistiek of de heuristiek ingeroepen. Deze stellen 
echter duidelijke beperkingen met betrekking tot het aantal 
mogelijke parameters als metingen en kenmerken. In principe 
kan dit aantal wel groot zijn, maar het aantal benodigde leer- 
objecten stijgt dan tot onverwerkbare waarden. Het aantal 
mogelijke parameters wordt beperkt door het aantal leer- 
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objecten. terwijl dit weer beperkt wordt door economische 
factoren en de grootte van de gebruikte rekenapparatuur. 

Een en ander heeft tot gevolg dat het merendeel van de her- 
kenningsproblemen onmogelijk geautomatiseerd kan worden 
wanneer men bij de opzet afziet van het inroepen van vêrgaande 
hulp van de menselijke herkenner. Voor problemen die in het 
geheel niet door de menselijke herkenner kunnen worden op- 
gelost Is, afgezien van een aantal detectieproblemen, automati- 
sering vrijwel in het geheel niet mogelijk. Hierdoor kan men 
zich afvragen in hoeverre de gekozen statistische en heuristische 
aanpak van het herkennen wel de juiste is. Bij onderzoek in 
deze richting kan het van belang zijn na te gaan hoe de mense- 
lijke herkenner in het algemeen werkt, dus niet toegespitst op 
een specifiek probleem. De onderzoekingen van Leeuwenberg 
(1970) gaan in deze richting [7]. Deze sluiten aan bij de zoge- 
naamde taalkundige benadering van patroonherkennen. Hierbij 
worden objecten beschreven met behulp van een ‘taal’ met een 
daarvoor gedefinieerde grammatica. Op basis van deze gram- 
matica wordt geclassificeerd. 
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Il. A General Coding System, Simulating the Human Classification 


of Visual and Auditory Patterns 


by ar Ld, Leeuwenberg, Psychological Laboratory, Catholic University, Nijmegen 


Synopsis: A theory is presented dealing with the specification of the structural units of information that are 
independently processed in the human perception of three-dimensional figures (shapes) and auditory patterns. 
Fhis theory implies that all types of shapes can be encoded in a formal language, which is maximally efficient 
and exhaustive. It is hoped that this language can give suggestions for the construction of a general pattern- 


recognizer. 


1. Model for the use of structural information units by the human 
mind 


One of the most baffling functions of the human perceptual 
system Is undoubtedly the ability to record the outside world. 
While concerning thinking or deduction. numerous laws have 
already been interred (logic) — so many indeed that it has 
seriously been questioned whether man in fact can think at 
all — with regard to the induction of concepts, httle to nothing 
is known. This last process occurs already at the very level of 
perception. It will immediately be evident that in perceiving 
two different triangles the two figures correspond with respect 
to the category of ‘triangularity’. The question here is: how 
does the perceptual system process the data of the patterns. 
such that precisely ‘triangularity’ is selected as the relevant 
category, while in principle an infinite number of categories 
could crop up in the mind? To this question the reply could be: 
“The perceiver counts the number of angles of each figure and 
then checks whether both figures have the same number of 
angles’. But what does the perceiver do with the two patterns 
of Fig. 1? 

The common category is ‘circularity’. Clearly, counting the 
angles does not lead to this conclusion. Could it be that the 
perceptual system tests all possible. ie. an infinite number of 
rules in a fraction of a second, or will it consider merely a small 
number of highly potential rules which indirectly involve many 
others? We shall proceed from the latter suggestion and shall 
attempt to establish the existence of such universal coding 
principles. 

Let us look at an example of how this investigation could be 
started. We will assume that a perceptual system is confronted 
with the two patterns of Fig. 2. 

Suppose we could take a look behind the eye of the perceiver 
and could discover there how the two configurations are re- 
corded in the brain, or, what is equivalent, how these figures 


Paper. read before the audience during the 214th Technical Meeting 
of the NERG, on 29 January, 1971, in the Conference Room of the 
Royal Institution of Engineers, The Hague. 
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are expressed in a new perceptual language. We assume for the 
moment that this language can be ‘read’. We may then find as 
the code for Fig. 2a: ‘concatenated small straight lengths of line, 
which consecutively form the following angles in relation to a 
lixed base: 0 , 90,0 ” As the code for Fig. 2b we may read: 
‘concatenated small straight lengths of line, which consecutively 
form the following angles in relation to a fixed base: 45°, 135”, 
45 … The first parts of the figure transcriptions are identical. 
We therefore understand that the perceiver can indicate the 
correspondence with respect to the straight lengths of line in 
the two figures. However, the latter part of the encoding does 
not show a ready-made similarity. The perceptual language we 
have used in our example is insufficient. Indeed a human per- 
ceiver would see immediately that the figures are almost iden- 
tical, one being merely rotated somewhat relative to the other. 
Let us therefore see whether we can improve the language. 

Suppose that in the brain of the perceiver another small per- 
ceiver (also known as homunculus) was busy with the as yet 
unrelated values: 0 90 0 and 45 , 135, 45. pairing them 
consecutively and subtracting them one from the other. Thus: 
90 —0 and —90 give 90 and —90 respectively; 135 — 
45 and 45 — 135 give 90 and —90 respectively. By means 
of this subtracting operation, the two initially unrelated angle 
series are made equal. Thus the interpretative description of 
each figure in terms of differences between consecutive angles 
is mn this case a better one than the translation in terms of angles 
in relation to a fixed base. 

Let us, for the time being, merely conclude from this the 
existence of a rather general property. We saw that in our ex- 
ample the perceiver first registered the angles. Only after this 
registration, did the super-perceiver (homunculus) begin to 
perform his subtraction tricks. The second perceiver, the super- 
perceiver, thus was building on the result of the first perceiver. 
Could it be that this strategy only applies in the translation of 
this pair of figures, or would it have a more general applicability? 

Let us apply the strategy to the translation of Fig. la. This 
could read: ‘dots in the configuration of a circle, in which to 
each dot a square is attached’. To begin with. the first part of 
this description has to be determined; only then can the second 
8 OKTOBER 1971 
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Fig. 1. Circular patterns. 


part specify the first. In other words: there is a hierarchie rela- 
tionship between the two parts of the description. 

The strategy discussed above has thus been applied in the 
translation of the figure. The translation is moreover psycho- 
logically relevant, for the first part of the translation describes 
exactly the ‘psychological’ similarity between Figs. la and Ib. 
One might go on in this manner, devising perceptual laws and 
testing these. The way in which we have made a start here may 
be very rough indeed. but any perceptual rule conveying a broad 
restriction may be of use. Typical examples of such rules are 
provided by the ‘Gestalt’ Laws. 


We shall now analyse in more detail the pattern of Fig. 3, to 
enable ourselves to give a preliminary outline of the coding 
system which we shall discuss later on, and to illustrate more 
clearly the principle of perceptual hierarchy. 

Let us trace how the pattern is stored by a perceiver, first at a 
peripheral level and subsequently at a more central level, in 
such a manner that, in agreement with considerations given by 
Attneave (1967), the recording at the latter level 1s less redun- 
dant than that at the more peripheral level. The peripheral re- 
cording might consist of the series of angles, formed at each 
dot, between its connections with the previous dot and the base 
axis. We then obtain, starting at point A, the following series 
of angles. expressed in degrees: 


46.46,46,46, 23,23,23,23, 0,0,0,0, -23,-23,-23,-23, -46,-46,-46,-46, 
-23,-23,-23,-23, 0,0,0,0, 23,23,23,23, 46,46,46,46, 69,69,69,69, 
N29292,02, 115,115,115,115, 138,138,138,138, 11511515 AIS, 
92,92,92,92, 69,69,69,69, 46,46,46.46. (1) 


Again we shall presume a homunculus, capable of transferring 
this series of numbers into a shorter form without, however, 


Fig. 2. Two similar patterns in differing positions. 
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Fig. 3. Curve of dots, arranged in groups on straight Ines. 


causing the immediate disappearance of the first redundant re- 
cording. The quadruplicity of the angle values may be expressed 
as follows: 


4-(46,23,0.-23,-46,-23,0,23,46,69,92,115,138,115.92,69,46) (2) 


Within the parentheses simplifications will appear. if instead of 
the values themselves their consecutive differences are con- 
sidered, in the same way as we have seen above. 

In order to show how this can be expressed symbolically, 
we shall now insert a minor example: 0,1,2,3,2 = / (L,L,L,-l). 
Between the parentheses following the / -sign, the differences 
are put in that have been obtained from a pairwise subtraction. 
Expression (2) may be translated to become: 


4 ( | (46,-23,-23,-23,-23,23,23,23,23, 
23,23,23,23,-23,-23,-23,-23) ) 6) 


Once again quadruplicity can be noticed. It is remarked that 
this will be possible only after the ‘translation by means of 


pairwise subtraction ( |) has been applied. Therefore, at the 


next recoding, a hierarchic transformation is performed. The 
result now becomes: 


A.(] (46, 4 (-23,23,23,-23) ) ) (4) 


Between the inner parentheses a symmetry is observed. This 
property of symmetry constitutes itself a simplifying perceptual 
principle. as has been demonstrated by Attneave (1954). 

Let us agree that R (a,b) = a.b‚b‚a. 
Recoding will give: 


4.(] (464-(R(-23,23) J)) (5) 
This might also be written as: 
A-(1 (46,4 -(R(H(23) JD) (6) 


In this way a figure may be recorded very concisely and very 
efficiently. One can attempt different sequence orders in the 
transformations, but. after some calculation, it will appear that 
generally only one sequential order is the most efficient. 

In this context the very pertinent question arises as to what 
determines the length or inefficiency of the formula. One might 
suggest that the greater the number of symbols in a formula, 
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the more inefficient it is. For instance, in the formula 3 x (a + h) 
seven symbols may be distinguished. However, these symbols 
are not independent of each other. The symbol x nor the 
symbols ( ) have a meaning if 3 were absent, and vice versa. 
We therefore regard 3 x ( ) as one given entity, or in other 
words as one ‘structural information unit’. Hence. this formula 
contains only three information units. 

As a general rule we call the symbols + and x operations, 
the ( ) symbols we call indicators. We attribute the name of 
|.R, +. and to nu- 
merical values. Thus the information of Fig. 3 amounts to 
7 units. In general we ignore the information concerning the 
tilt of the figure. in this case 46 and thefirst / -transformation, 
so that Fig. 3 contains 5 rather than 7 units in its final code. 


structural information unit to the signs 


The coding system which we are about to discuss has in first 
instance bearing on two- and three-dimensional structures. The 
system can also be applied, as will be shown, to auditory pat- 
terns. The coding system for two-dimensional figures has been 
described elsewhere (Leeuwenberg 1968, 1969). Nevertheless we 
shall frequently return to this, because the encoding of three- 
dimensional structures contains simplifications analogous to 
those of the two-dimensional coding procedure. At first our 
pattern-language will make the impression of being very com- 
plicated, both because the analogies become clear only after- 
wards, and because we present the system of rules in a very 
formal way. 

In presenting this model we do not wish to suggest that no 
other possible codes of figures do exist, such as those occurring 
specifically at short-term memory level, or in imagination 
(Moran 1969). Moreover we leave out of consideration the 
manner in which in a certain context representations of struc- 
tures may be laden with meaning, when evoked in a human 
perceiver. In other words, the coding system we present is re- 
lated to the ultimate cognitive representation of structures to 
be expected in long-term memory, in so tar as these structures 
are free of meaning. In this coding system various perceptual 
properties can be abstracted, such as: ‘information’, ‘similarity’, 
‘hierarchy’, ‘regularity’, and ‘redundancy of figures’. By means 
of these quantiftable properties quantitative tests of perception, 
of organic cerebral disorders, and of fluid intelligence (Cattell 
1968) may be developed eventually. Another effect of using this 
coding system could be that it may yield suggestions for models 
of pattern recognition. 

In our discussion, an attempt will be made to substantiate 
the choice of coding rules. In the next section these coding rules 
will be set out. Subsequently. we shall consider some examples 
for illustrative purposes. 


2. Coding Rules 


2.1. Struetural Information Units. 


l.n — ‘number’, as in: a.d.a. = À (a). This information may 
specify any size. 
2. | — — “integration’: | (3,2,5) = 0.043, 04342, 


OH34H+2+5= 03,5, 10. 
— “reversal’: R[3,2,5] = [3,2,5], [3.2.3]. 
— “left-right variation’: + (90 ) = 90, — 90. 


2.2. Operators. 


|. + — addition: 543 = 8. 
2. Xx — multiplication: 5x 3 = 15, 
3 — iteration: 3: (a) = a.a,d. 


Fig. 4. Addition of two angles. 


4, * — angle addition: In analogy to the addition of angles 
in the multiplicatian of vectors; unlike vector multi- 
plicatton, this operation does not affect length (see 
Fig. 4). 

3. @ — addition of coincident angles; see Fig. 5. 


This operation holds only if two figures meet each other (here 
in point P). The operation Is used in order to maintain certain 
patterns — like mm Fig. 5 [10,10,10,10,10,10| — invariant under 
topological transformations such as the ‘curved surface’ [0,0,0,- 
45,45,45|. We shall give examples of this further on. when dis- 
cussing Figs. 10 g, j, |. 

It will be made clear later, why these numbers are usually 
enclosed by “the ‘absolute signs’ |… |. 


2.3. Indicators. 


L je ) — continuation: (* ) WAA Bs an vas ei. 
| This continuation holds until the sequence meets 
| | ‘something’, e.g. a line or a surface. 


ies 


chunking: 2: [a,b] = a.h‚a.b. The sequence within 
these signs is treated as one unbroken unit in every 
context. 

«| — border signs: These signs are rather meaningless 


and often redundant. For example, 2 - (ap) = 


a.a,h‚h. The enclosed values do have a common 
fate, but function separately. Furthermore. these 
signs enable the applicability of the rule that in 
the reconstruction of a formula the most deeply 
embedded values are solved first. 


4, if =S breakdown into elements: lay = ab. 


These signs have the opposite effect of […]. How- 
ever. this is only partly the case. They divide the 
enclosed group into subgroups by one step only. 


an ed | = (asbl, fe. 


Je — take sign: the functioning of an enclosed value 
Û continues until it has been combined with all the 


For example: 


dlo,0,0,45,4545[p fa 4| 10,10,10,10,10,10 Ik = [10,10,10,10,55,55 | 
| =| 0, 0, 0,45,45,45 | 


10 ze 


Fig. 5. Addition of angles over shifted junctures. 
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unenclosed adjacent values. [2s) tab) = 


2- (ad. 2: (B). 3 (a). 3: (hb). The normal situation 15: 
2,5) (a,b) = 2 (a), 3-(b). 


6. Ï — complete breakdown into elements: These signs 
represent the total opposite of the [.…] signs. They 
break the strongest chunk into its utmost smallest 
elements. For example: a led] p= a.be.d. [ 
8 | | 
Ò | | — absolute siens: The enclosed values refer to angles 57e | | 8 
determining sequentially connected straight lengths SE e Se SA 
of line. These angles are, however, related to one il Sa DH 
reference base-axis. When angles are not enclosed S | ee 
by these signs, then every value refers to the angle wi 
between a piece of line and the continuation of mn 
the previous line. They form ‘relative angles’, for Fig. 7. Outerproduct of positive angles. 
example: [17”, 33°| = 17°, 16” (see Fig. 6). 
B. |. independence of angles: (ab) || (e.d). meaning that 
a and h do not form the reference axis for the 
angles ce and d. (In this case c and d are dependent 
a 0 sed ken, elements in the formula. if the second angle (in 
When dq and h in their tum are dependent on p this case —90°) of the couple determining the 
and v, while c and dare also angularly independent outerproduct. passes from a positive to a negative 
Ln En can 9 Detiege by ((0,7)(4,5)) IUI value, or vice versa. In general, the right-hand rule 
(cd), where [II is substituted for Ik has to be applied to the rotation of the reference 
ak he ae he We al ze $ hi (Eie,1. is this axis of two successive angles, if the second angle 
series the last angle (45 ) is measu red in the plane, is positive, while the left-hand rule must be applied 
determined Gj We OULEFPrOUG ar the EEEN if this second angle is negative, to make the suc- 
akan es 67 arn ie aa Kele As of ceeding structure invariant with respect to the sign 
the angle of 45 (which Is the second leg of the of the second angle of an outerproduct-couple. 
angle of 67 }. This plane is perpendicular to the 
plane in which the angle of 67 is positioned, and In the case (14°, 67°} & {<|90°, 45°|> ; the 
contains the perpendicular that can be erected on 45 is not an ‘outerproduct’ determined by the 
the latter plane. This perpendicular matches to the last two angles 67°. 90, but determined by the 
plane of the angles of 14 and 67 in accordance pairs of angles at the left side of the +-sign (in 
with the right-hand rule when turning the reference this case 14”. 67 ). This exception only is found 
axis, determined by the angle of 14 , towards the when the operation = is present. Later we shall 
reference axis, determined by the angle of 67 . give an explanatory example (see Fig. 10 I). 
The positive direction for the angle of 45 Is given 10. — vanishing sign: (see Fig. 9). 
by turning its second leg around its juncture from 
the reference axis towards the perpendicular, as All the values function normally as existing ele- 
shown in Fig. d. ments, but they are invisible. An exception to this 
In cases where there are more included angles, rule is the case in which there would be no differ- 
as in: 14°, 67 . € -90°, 45°), Fig. 8, every in- ence between the situation with, and without, 
cluded angle is also an ‘outerproduct’ of the refer- 
ence axis of the last two angles. Hence, 45 is an 
‘outerproduct’ of 67 and —90 . However. the 
right-hand rule must be applied to the rotation 
determined by 67 . +90 , in order to avoid a 
change in the structure represented by following 
Pr E i 
A 


Fig. 6. Interrelation of absolute and relative angles. Fig. 8. Outerproduct, when the second angle is negative. 
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A0, A= 0,0 B _ÁA 


8, 2-10, ad, „„ä= _ 


Fig. 9. The sense of the vanishing sign. 


signs; then the values do not function normally 
(see description Fig. 10 ce, d, hi). 


3. Combinatory and Implicit Rules 


Combination: 


(a.bhle.d) = ac. b.d 


(a,b}le.d] —= a. [e.d]. h. [e. d] 
la.bl(e.d) = [a, hb], c, [a, bl, d 


For Operations: 


(a,b) + (e.d) =ütebt+d 
(ab) + [e.d] = à + [c, dl, b+ [ed] 
ab +f(ed) =[ate,a+d).[b+e,b+dl 


These three hold for all the operations (+, x,:.*). For + and 


* holds: a + [b. c] = [a +b, c]. For iteration: 2: (a b) = a,a.b‚b 
and 2: [a b] = [a,b], [a,b]. 


For Onesided Îteration: 


(3); (a.bMle.d) = a.ba.c.ba.b.d 


Iteration is wanted only for the first group, indicated by the 
point in the sign ;. This means: take three elements from (a,b). 
then one from (e.d). continue with three elements from (a,b) 
and one from (cd). etc. 


® 
inn 
- . Pá 
Se 
LJ 
(a) bj (c) 


Fig. 10. A series of figures of increasing complexity. 
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(2): (a.blle.de) = a,c,‚d,b‚e,c„a,d,e,b,cd,a,e.c,b.d,e 


In this second example iteration is wanted for the second group. 
indicated by the point in the sign :. This means: take one ele- 
ment from (a,b). then two elements from (c‚d‚e); continue with 
one element from (a,b) and two elements from (c.d‚e). etc. 
Likewise we have: (1-2): (a) (hb) = a. bh, a. hb, b. 


The same can be applied to +, viz.: 
5E) =de 
3 


Kad Lid 
min 
Nn 
ie ap 
Us 
+ 
ak 
KCH 
TN 
| 


Serial Structure: a, 4 (0), a, 4 (O0), etc. = Ca. [4 - (0)] ) 
(see Fig. 10a). ( ) 


At nodes, from which different branches arise, we use the paral- 
lel structure representation; in other configurations the normal 


serial structure is used. 


Parallel Structure: 


d.d (0) 

EO) On | 
a SMO (E05) 
a. 4 (0) 


etc. (see Fig. 10b). 


The upper angles form the reference bases for the lower angles 
and have common starting points. 


4. Examples and Analogies 


With the aid of some examples, we shall now attempt to make 
more clear how visual structures of two and three dimensions 
as well as auditive structures may be encoded by means of 
these coding rules. Generally we shall in a first stage express 
visual patterns in terms of relative angles (see section 2, Indi- 
cator 7 and Fig. 6). Further, let us agree that the first ten letters 
of the alphabet be used to symbolize angles. while the remaining 
letters represent numbers. Accordingly, Fig. 10a may be en- 
coded, as we saw above, in the following manner: 


ner 
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er, | „O1 ‚If nis sufficiently small, this polygon approaches 


a circle. Thus both configurations contain two information units. 


Fig. 10b may be described by: a,‚|n-(0)| „Just as in this case 
the ) symbol may be used for serial as well as for parallel 
formula-structures, so all combinational rules may be used both 
for the two-dimensional, serial. horizontal formula-structures. 
and for the parallel, vertical formula-structures which are 
primarily suitable for three-dimensional figures. The two- 
dimensional parallel structure of the formula of Fig. 10e is 
an example of this. Its code reads: 


nn in, 


apr) 
\ (10e) 
Ek Mel 
b.p-(0) 


This means: take an element (angle) of the polygon “ | 1-01) 


and attach to it a straight line p - (0) of length p. This straight 


line is linked at an angle h to this element of the polygon. As the 
combination rule (given by the brackets) dictates, one must now 
A 
return to the next element (angle) of the polygon (4 |[1- (0) } 
This element should now be attached, not to the straight line 
p : (0) just mentioned, but, as the vertical structure of the for- 
mula indicates, to the element of the polygon mentioned first. 
Subsequently attach to this, again, a straight line p - (0) at angle hb; 
and so on in the same manner. 


An example in which a vanishing sign finds expression is Fig. Oc, 
whose code reads: 


(a, [-O1) (10e) 


Analogous tu Fig. 10c, Fig. 1Od may be written as: 


(tao) 
( „[r-{O)) 


hm end 


‚b, p-(0), 


(1Od) 


Fhis already constitutes an exceptional case, as not only ” « (0) 
itself disappears, but also its further function, this being re- 
vealed by the fact that were # « (0) has disappeared, p * (0) has 
also disappeared. [f, in this case, this had not been so, the for- 
mula would have also applied to Fig. 10e. The vanishing sign 
would not have had any meaning, in contrast to the case of 
Fig. 1Oh 

First we shall show the meaning of the “independence ot 
angles’ indicator No. &. Fig. 1Of may be coded as: 


ib LOF) 


Angle b is indeed linked to the elements (angles) of the polygon 


En [rn - (0)] ‚ however, it is not dependent on the angles a, 
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but on the ‘absolute’ base in relation to which the a-angles were 
referred in the first instance. 


The following examples deal with the very complicated use of 
operation 5 (Section 2.2.). The formula of Fig. lÜg is made up 
of two parts: viz. that for a star and that for a straight line. 
However. the line in the figure is not in fact straight, tor at 


every point ( P) where it intersects („) the radials 


of the star, a constant absolute angle (|[70 |) is made with 
these radials (*). In this way the line Is transformed into a 
spiral by virtue of its relation to the star. The representation of 
pn Sn Og is: 


dale [n- 0) je @ ) 1-0 (10g) 


and the formula for Fig. 10h, where the star ‘vanishes’ from 
the spiral is: 


a. n-(0) „4 -C0)p 


mm mmm | 


(LOh) 


The reason why the angles on the right-hand side of the formula 
are absolute is because they form a constant 70 with the abso- 
lute reference axes formed by the radials of the star which ís 
described in the left-hand part of the formula (cf. Fig. 10b). 
In fact. the left-hand pattern must first be constructed before 
the right-hand. pattern can be superimposed on it. Once the star 
pattern has transferred its directional function on the line 
|k - (70}| the star as such can vanish. 

A similar process may be seen in the relation between Fig. 10: 
and Fig 10j. Fig. 101, represented by m1: | [(O, 180)(90)[}, may 
be recognized in the formula for Fig. 10j. This 1s m agreement 
with the fact that pattern 101 can easily be recognized percep- 
tually in pattern 10j. Fig. 10j is represented by: 


| a. tl hd 0) mn. lo. 150) (90) | (10) 


The left-hand part again describes a star with infinitely long 
radials. Even though this star pattern vanishes, it still has its 
effect on the figure which corresponds to the right-hand part 
of the formula. This part first follows one of the radials of the 
star for a certain length 7: « (0) which later vanishes and then 
the castellated structure m1 « {|0,90,180,90,0.90,180.90,0, etc. |} 
is attached, in such a way that it is turned by the invisible star, 
which provides a new base plane. 

The same procedure holds for the representation of pattern 
10 1, in which also pattern 10i is present, invariant under the 
topological surface transformation which is described in pat- 
tern 1Ok and represented by: 


Cs n-(0)) 
je” (0), (IO k) 


[ EG | 
<90 >, m-(0) 
en 
The representation of pattern 10 1 is: 


a,| (0, | 


fikt dn 0, ISO) (90 | > | 


K hm ef 
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Fig. 11. Two-dimensional ribbon pattern. 


Pattern 101 is composed of 1Ok and 10í. Pattern 1OK is repre- 
sented by the left-hand and 101 by the right-hand part of for- 
mula TOL Because of the combination of the * and {< > signs, 
the angles at the right-hand side form an ‘outer-product’ with 
the surfaces, constituted by the angles of the left-hand side 
figure. However. this ‘outerproduct’ occurs only between those 
right-hand side angles which coincide with left-hand side angles. 
In order to specify these angles, the left-hand side figure has 
to be constructed first and then the right-hand side figure must 
be superposed on this figure step by step. So it is not possible 
to construct the shape of structure LOI directly from the two 
sub-structures 1Ok and 10. 


The proposed formulation of Fig. 101 is analogous to that 
for the construction of a drawing 101 on a curved surface. The 
usual way to construct Fig. LOI is to draw 10i on a sheet and 
then to bend the sheet in a circular way. The 10i drawing and 
the circular bending are the two constituents of the formula. 
As another complex configuration pattern X is analysed in 
Fig. 11. It ís a composition of the sub-structures N, P and Q. 
The structures P and Q are fitted into the sinus superstructure N. 
They contain both cruciform (structure J) and circular (struc- 
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ture G) patterns. Pattern X as a whole can also be considered 
as being built up from the fine structures A. B and D. In order 
to show that in pattern X the eruciform patterns are not only 
angularly independent of the circular structure, but also of the 
sinus superstructure, indicator & (Section 2.2.) is used there 
twice in pattern P. 

In general, subprocesses in the construction of a shape cor- 
respond to the units in the representation of the shape. The 
operation = allows also the formulation of two- and three- 
dimensional structures superimposed on three-dimensional 
shapes (see Fig. 12). 


We have become acquainted with an example in which a com- 
bination rule has been applied vertically. Now we shall intro- 
duce an example in which many combination rules (also verti- 
cally applicable) are applied horizontally. For a change, we 
shall employ an auditory pattern as our example, viz. the fol- 
lowing series of values corresponding to the pitch of tones: 
2,6,-2,7,3,6,-3,7,0,8,-1,6,2,7,-4,6.4,7,-5,8,5,6,-3,7.4,8,-4,6,3,7- 
-2,6,1,7,-2,8,2,6,-3,7,3,6,-0,7,4,8,-4,6,5,7,-5,6.0.7,-1,8,2,6,- 
3.1,3,6, etc. (S). 


From it we arrive by successive steps of encoding at (see Table 1): 
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Table 1. Encoding steps and resultant coded representation of the series (S). 


pen 


33,4,4,3.2.1,2.2,3.3,0.4,4,5.5,0,1.2.3.3,4.4, etc.) 


223, -3,0.-1.2.-4,4,-5.5,-3,3,-3.4.43,-2,1.-2,2,-3,3,-0,4,-4,5,-5,0,-1.2, etc.) (67.678) ) 
(23-30 )-1,2.-44,-5,5.-3,3-3,44,3-21-2,2,-3,3,-0,4,-4,5,-5,0,-1,2, etc.) 42 -[6,71.8} 
) 

ed, 


( 


(GHG 3A45.53 


AAA etc.)(0,1,2,3.3.2. 0 


| H3022233445.5,33, 22AA. etc.) R[0.1,2.319) 


VEEL 2233445,53344223 ete.) ARI LOL DJ) 
‚ (3.15:(2.2.3.3.4,4,5.5,3,3.4,4.2.2.3.3. ete. R[ |G - CD), 
a ne (132) {LZ 2PERT 1 (3 (D)]) 
Finally: 
( tis D): Ú 12) [2 (LDNER[L 3 -DN 2 (6.71.81) 
A tt + „4 t tr T Pr CREE 1 


ee 


This is the shortest structural description of the above pattern 
(which. in fact continues much farther than is given here) with- 
out any recurrence. The number of different information units 
is 17. They are pointed out by arrows beneath the final formula. 


A further analogv between two- and three-dimensional struc- 
tures is this: for the description of two-dimensional structures, 
the relative angle forms the basic element. This relative angle 
indicates only how a straight line is determined if the previous 
straight line is known or determined. Similarly, for the third 
dimension. a straight line can be determined via the ‘outer- 
product’ only if the two preceding straight lines, whose sequen- 
tial order is also given, are known or determined. In general, 
therefore. it applies that not absolute data, but rather the ele- 
mentarv internal relationships in this system constitute the 
basic data for coding. 


Se Number of 


information units 
15 
interpretation by formulas : 
PE 
| Í a, [n-(01]| Ee 
es Í\ <= (7 { (0,180) (201 }) = 


\ [ -90,S-b=,01] 


en (2d) En (01) | nn 
ao, (ol k fe Í |-s01)} 


Fig. 12. Threc-dimensional figure. on the surface ot which a 
three-dimensional pattern is introduced. 
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Discussion 


Up till now only the formal coding language has been presented, 
but the arguments that make clear that this system is analogous 
to the human perceptive system have not yet been discussed. 
However. elsewhere (in the American Journal of Psychology. 
in press. Leeuwenberg) is demonstrated how from this system 
predictions about the human perception of patterns are made 
and tested. 


With respect to the problem of how to automize pattern re- 
cognition processes. this coding language can give suggestions 
for the building of a general pattern recognizer. It seems not 
so difficult to me to construct a program which enables a com- 
puter to draw the figures, given the formula; however, it is 
more troublesome to propose a program that would enable an 
automaton to develop the most economical formula, given the 
figure. Such an automaton may be thought of as the initial 
stage in the building of automatons which can handle specific 
sets of stimuli, e.g. characters or numerais, In the latter case, 
new relevant features may be evoked by the actual limitations 
of the set of stimuli and the specificity of the task facing the 
computer on the basis of different frequencies occurring within 
the set of stumult. 
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HL. Stand van de techniek met betrekking tot het automatisch lezen 
van met de hand geschreven cijfers 


door A. A. Spanjersberg, Dr. Neher-Laboratorium, PTT. Leidschendam 


Synopsis: State af the Art in Automatic Reading of Handwritten Dieits. 

A description is given of the principles of some of the reading machines, which have the possibility of reading 
stylized handwritten digits. The methods of scanning and recognition applied in these machines are discussed. 
Attention is paid to the recent development of optical reading terminals. Practical results are given, obtained 
mn automatic reading of non-stylized digits on letters by applying an optical reading-sorting machine. A project 


of present interest in the field of automatic reading is mentioned. 


It is recommended that a reference set of handwritten digits be composed. Some considerations are given 


which could be useful at the composition of such a reference set. 


1. Inleiding 


Bij het toepassen van elektronische informatieverwerkende 
machines voor administratieve doeleinden, bleek er behoefte 
te zijn aan methoden om visueel leesbare informatie direct in 
die machines in te voeren. Bij de studie van dit probleem werd 
men geconfronteerd met de verschillen tussen het menselijke 
perceptie- en interpretatievermogen en de mogelijkheden die 
machines op dit gebied bieden. 

Omstreeks 1955 werd op velerlei plaatsen, verspreid over de 
gehele wereld, de studie van het machinale lezen aangevat. Er 
is sindsdien een aantal publikaties over dit onderwerp versche- 
nen en er zijn ook veel praktische toepassingen gerealiseerd, 
wat betreft het lezen van informatie aangeboden in de vorm 
van gedrukte tekens of in die van machineschrift. De wenselijk- 
heid om te kunnen beschikken over leesmachines voor met de 
hand geschreven schrift werd eveneens in een vroeg stadium van 
de automatisering bij administratieve processen onderkend. 

Bij het bestuderen van de mogelijkheden tot automatisering 
van de Postcheque- en Girodienst werd gezocht naar een moge- 
lijkheid om de geschreven numerieke informatie van rekening- 
nummer en bedrag automatisch in het centrale boekingsproces 
te kunnen invoeren. In de beginjaren van de automatisering, 
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rond 1957, waren de technische mogelijkheden hiervoor belang- 
rijk minder dan thans. Er werd gedacht aan documenten met 
zen. merkroosters, waarvan in fig. |l een voorbeeld is aange- 
geven. Hiermee zijn proeven genomen, waarbij ook rekening- 
houders werden ingeschakeld. 

In technisch opzicht leverde de verwerking van dit soort docu- 
menten geen problemen op. Veel werd echter gevraagd van het 
aanpassingsvermogen van de mens. Het is dan ook, uit ergo- 
nomische overwegingen, dat men van dit soort invulroosters, 
althans bij de postgiro, voorlopig is afgestapt. 

Bij de industrie werden soortgelijke systemen ontwikkeld. 
Voor een aantal toepassingen worden ze nog gebruikt. Gezien 
de ergonomische moeilijkheden bij het invullen en teruglezen 
van de merkrooster-documenten blijft de aandacht toch gericht 
op het machinaal herkennen van geschreven cijfers. 


2. Industriële ontwikkelingen 


Voor zover mij bekend, was de eerste die een redelijk werkend 
model van een leesmachine voor met de hand geschreven cijfers 
construeerde Dr. Sprick, verbonden aan het IBM-laboratortum 
in Böblingen (W-Duitsland). Zijn ideeën zijn later mm Amerika 
NR 40 
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Fig. Ll. Voorbeeld van een ‘merkrooster’, 


nader uitgewerkt, o.a. door Greanias, en dit heeft geleid tot 
de machine die door IBM onder het typenummer 1287 aan de 
markt wordt gebracht. Er wordt bij deze machine een bijzondere 
aftastmethode toegepast, een variant op de zgn. ‘flying-spot 
scanner’. Bij de ‘flying-spot’ aftastmethode (fig. 2) wordt op 
het scherm van een kathodestraalbuis een hichtstip gevormd. 
Door middel van een lens wordt de lichtstip op het af te tasten 
document afgebeeld, Een deel van de door het papier gereflec- 
teerde hoeveelheid licht wordt met behulp van een andere lens 
op de kathode van een fotomultiplicatorbuis geworpen. De 
positie van de lichtstip wordt bestuurd door middel van de 
afbuigstroom in de deflectiespoelen van de kathodestraalbuis. 
In veel gevallen wordt een lijnvormige aftasting toegepast. De 
waarde van het video-signaal is evenredig met de plaatselijke 
reflectiecoëfficiënt op het document. In de genoemde lees- 
machine type 1287 vindt een contouraftasting plaats. Hierbij 
volgt de lichtstip de contouren van een af te tasten teken. De 
hichtstip maakt een gecompliceerde cirkelvormige beweging 
(fig. 3). Deze ontstaat o.m. wanneer een sinusvormig met de 
tijd verlopende stroom door de horizontale afbuigspoel en een 
cosinusvormig met de tijd verlopende stroom door de verticale 
afbuigspoel wordt gevoerd. Voorts wordt de versterking van de 
versterkers die deze afbuigstromen leveren gedurende het af- 
tasten van zwarte beelddelen gehalveerd, Daardoor ontstaat 
het volgeffect langs de lijnen, zoals afgebeeld in fig. 4. Bij een 
richtingsverandering van 180 , zoals ook zou optreden bij een 


\ 


\ / 
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Fig. 2. Principe van de flving-spot aftasting. 
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Fig. 3. De contouraftasting van een teken. 


kleine lijnonderbreking, wordt getracht of het mogelijk is met 
een grotere amplitude van de afbuiging de onderbreking te 
overbruggen. In fig. 5 is deze werkwijze aangegeven. De be- 
schreven aftastprocedure vindt voor elk teken tweemaal plaats. 

De eerste maal wordt de grootte van het cijfer bepaald en 
wordt een denkbeeldige rechthoek gevormd die om het cijfer 
past. De rechthoek wordt verdeeld in een matrix van 4 « 5 een- 
heden (fig. 6). In elk der deelvakjes wordt de lokale richting van 
de lijn in eenheden van 30” bepaald. Men onderscheidt dus 
12 mogelijkheden. Deze richtingen komen overeen met de kom- 
pasrichtingen. Er zijn 20 deelvakjes. De informatie-inhoud van 
een cijferafbeelding kan dus beschreven worden met 9 bits, nl. 
5 voor de positie van het vakje en 4 voor de lokale lijnrichting. 

Gedurende de wereldtentoonstelling, die in 1964 in New York 
werd gehouden, werd deze leesmachine gedemonstreerd. Bezoe- 
kers konden op een kaart een datum schrijven, vanaf het jaartal 
1851, Langs automatische weg werd dan de titel van het hoofd- 
artikel van de ‘New York Times’ van de geschreven datum op 
een kaart afgedrukt. 

Om met de leesmachine voor de praktijk bevredigende resul- 
taten te kunnen behalen, moeten bij het schrijven op de te ver- 
werken documenten enige schrijfvoorschriften in acht genomen 
worden. De fabrikant van de machine beveelt dan ook gebruik 
in een zen. ‘controlled environment’ aan, waarbij de mogelijk- 
heid aanwezig is de deelnemende personen te instrueren. Er zijn 
enige publikaties over toepassingen van deze machine, waaruit 
valt af te leiden dat goede resultaten bereikt kunnen worden. 


Een andere machine. welke mn eerste instantie werd ontwikkeld 
voor het lezen van machinale afdrukken, zoals schrijfmachine- 
schrift, kan ook met de hand geschreven cijfers lezen. Deze 
machine werd vervaardigd door de Amerikaanse onderneming 
Recognition Equipment, welke zich uitsluitend toelegt op het 
ontwikkelen en produceren van optische leesmachines. De te 
lezen cijfers behoren met een zacht potlood volgens een model 
geschreven te worden binnen voorbedrukte vakjes. 

De aftastinrichting bestaat uit een matrix van 12» 48 foto- 
elektrische cellen. Elk schrijfvakje wordt afgetast met een ma- 
trix 12 « 16 fotocellen. Omdat de cellenmatrix van de aftast- 
inrichting groter is dan een schrijfvakje op het document, is 
een zekere vrijheid toegestaan in de positionering van de schrijf- 
vakjes ten opzichte van de aftastinrichting. Elke fotocel, die 16 
verschillende grijstrappen kan onderscheiden, Is via een elek- 
trisch netwerk verbonden met 24 omliggende cellen. De waarde 
van het zwartniveau van al deze omliggende cellen is van belang 
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Fig. 4. Detail van de contouraftasting. 
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Fig. 5. Het overbruggen van een lijnonderbreking. 


bij de beslissing of een beeldelement als wit of zwart beschouwd 
moet worden. Hierdoor heeft men bereikt dat de leesresultaten 
weinig beïnvloed worden door een minder goede afdrukkwali- 
teit, wanneer gedrukte tekens gelezen worden. Voor de her- 
kenning worden de afmetingen van een cijferafbeelding eerst 
genormeerd. De matrix van 12 « 16 beeldelementen wordt ver- 
volgens onderverdeeld in 9 horizontale zones, die elkaar over- 
lappen. Per zone vindt een analyse plaats van de waargenomen 
informatie. Er wordt getest op de aanwezigheid van de karak- 
teristieke kenmerken, die in fig. 7 zijn aangegeven. De onder- 
linge relatie van deze kenmerken wordt gecodeerd, evenals de 
positie binnen de matrix. Op grond van deze kenmerken vindt 
de herkenning plaats. Per seconde kunnen 2400 tekens worden 
gelezen. Dit geeft een indicatie van de snelheid waarmee de 
verschillende deelprocessen afgewerkt moeten worden. 


3. Recente ontwikkelingen 


Bij het toepassen van lezende machines bij administratieve pro- 
cessen heeft men onderkend dat niet alleen de functie van het 
lezen der informatie van belang is, maar daarnaast ook het ge- 
hele verwerkingsproces van de documenten. Dit omvat het 
papiertransport, een sorteermogelijkheid voor de documenten, 
de mogelijkheid om de gelezen informatie in de vorm van een 
code op het document aan te brengen, de mogelijkheid om docu- 
menten met niet-leesbare informatie te merken en apart af te 
leggen, enz. Ook de mogelijkheid, documenten van verschillende 
afmetingen en van verschillende papierkwaliteiten te verwerken, 
kan vaak van doorslaggevende betekenis zijn voor de praktische 
bruikbaarheid van een machine. 

De ontwikkeling geeft dan ook als beeld te zien dat men lang- 
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Fig. 6. De normering van een teken en de coderingsmogelijkheden 
van de hellingen der lijnen. 
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Fig. 7. Karakteristieke kenmerken, waarin geschreven tekens ontleed 
kunnen worden. 


zamerhand van het denken over een machine overgaat naar het 
denken in een systeem. Alle bouwstenen van het systeem dienen 
een grote mate van flexibiliteit te bezitten en ze moeten gemak- 
kelijk kunnen worden aangepast aan de wensen van de gebrui- 
kers. Bij de grote, snelle leesmachines vormt het documenten- 
transport een niet te verwaarlozen post in het gehele systeem. 
De verwerkingssnelheid heeft weer vèrgaande consequenties 
voor de middelen waarmee de aftasting moet plaatsvinden. Ook 
hangt hiermee de voor de herkenningsprocedure beschikbare 
tijd samen. 


Als een nieuwe ontwikkeling kan genoemd worden het auto- 
matisch lezende eindroestel. Recognition Equipment heeft on- 
langs het optisch lezende eindtoestel, bekend onder de type- 
aanduiding “Input 3’ op de markt gebracht. Met deze machine, 
die als tafelmodel is uitgevoerd, kunnen in een langzaam tempo 
documenten automatisch worden gelezen. Het is mogelijk een 
aantal van deze lezende perifere toestellen op een centraal op- 
gestelde computer aan te sluiten. Bij de toepassing van dergelijke 
perifere toestellen onderscheidt men de zgn. IT (ntelligent 
Ferminal), waarbij de herkenning in het perifere toestel plaats- 
vindt, en het NIT (Non-/ntelligent Terminal), waarbij in het 
perifere toestel slechts de aftasting van de te lezen informatie 
plaatsvindt. 

De genoemde ‘Input 3’ 1s een IT, welke geschikt is voor het 
lezen van gedrukt en getypt schrift van een aantal gestandaar- 
diseerde schriftsoorten, Ook kunnen gestileerd geschreven cijfers 
en een paar extra tekens worden gelezen. Om deze mogelijkheid 
wordt deze machine hier genoemd. In fig. 8 is de mechanische 
opbouw van de aftastinrichting van de machine getekend. De 
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Fig. 9. Gestileerd geschreven cijfers. 


aftasting vindt plaats met een door een motor aangedreven 
schijf met gaatjes (a). Het document wordt verlicht met twee 
lampen (b). Het gereflecteerde hicht dat door een gaatje van de 
schijf valt, wordt gefocusseerd op een foto-elektrische cel. Wan- 
neer het document in de aangegeven richting wordt getrans- 
porteerd (ec), en de schijf bovendien een voldoend groot aantal 
omwentelingen per tijdseenheid maakt, zal elk teken met een 
aantal, nagenoeg verticale, beeldlijnen worden afgetast. Wan- 
neer de tekens op een regel afgedrukt zijn, gaat de voortbewe- 
ging in de langsrichting van die regel. Wanneer een aantal regels 
op een document afgetast moet worden, wordt na elke regel 
het document zodanig verschoven, dat dan de volgende regel 
gelezen kan worden. De gehele aftastprocedure wordt door de 
processor bestuurd en is dus volledig flexibel. Wanneer docu- 
menten met handschrift ingevuld moeten worden, zijn op de 
daarvoor bestemde plaatsen rode verticale lijnen voorgedrukt. 
De cijfers moeten nu in zwarte mkt of potlood dóór die lijnen 
geschreven worden. De cijfers zijn gestileerd, althans zij behoren 
dat te zijn (fig. 9). De herkenningscriteria zijn zeer eenvoudig: 
door de verticale streep wordt een teken verdeeld mm links en 
rechts. Voorts kan men een onderste en een bovenste deel aan- 
wijzen. De voornaamste herkenningscriterta zijn: 

het aantal doorsnijdingen in het midden: 

de aanwezigheid van zwarte lijnelementen in elk der kwa- 

dranten: 

het wel of niet gesloten zijn van de hijndelen in elk der kwa- 

dranten. 
De leessnelheid van deze machine bedraagt ongeveer 40 tekens/s. 


4. Een leesinrichting voor niet-gestileerd schrift 


Een geheel andere en interessante ontwikkeling heeft zich in 
Japan voorgedaan. In het kader van de automatisering van 
de briefpostverwerking heeft het Japanse ministerie voor pos- 
terijen kunnen bereiken, dat op alle brieven, briefkaarten, enz. 
die m Japan worden verstuurd, enige schrijfvakjes op een vaste 
positie t.o.v. de rand zijn voorgedrukt. In deze schrijfvakjes 
wordt de 3-cijferige postcode van de plaats van bestemming 
geschreven in normale, dus ‘Arabische’ cijfers. De Japanse 
onderneming Toshiba (afkorting van Tokyo Shibaura Electric 
Company) heeft een lees-sorteermachine voor poststukken ont- 
wikkeld. Thans zijn reeds in een 20-tal postkantoren in Japan 
deze lezende sorteermachines in gebruik. Vóórdat men met het 
ontwerpen van de leesinrichting begon, werd een uitgebreid 
onderzoek verricht naar de wijze waarop cijfers geschreven 
worden; 300000 cijfers werden verzameld. welke door 15000 
personen geschreven waren. Er werd een aftastinrichting ge- 
bouwd voor het nauwkeurig aftasten van het te lezen materiaal. 
De met het lezen verkregen informatie werd voor analyse en 
het vaststellen van aanwezige kenmerken in een grote com- 
puter ingevoerd. Elk schrijfvakje werd hierbij ontleed in 42 

60 — ruim 2500 beeldpunten: de signaalwaarde van elk beeld- 
punt werd zodanig gecodeerd, dat 8 verschillende grijsniveaus 
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konden worden onderscheiden. Dit laatste was gewenst, om- 
dat men aan het publiek niet ‘speciale’ schrijfinstrumenten 
wilde voorschrijven en omdat men een indruk wilde verkrij- 
gen omtrent de variaties die bij de diverse gebruikelijke inkt- 
soorten in de reflectiecoëfficiënt optreden. 


Met behulp van computersimulatie werd een geschikt herken- 
ningssysteem ontwikkeld. Men kan dit in grote lijnen als volgt 
omschrijven: 

Het herkenningsproces is een data-reductieproces waarmee 
het grote aantal bits dat bij de aftasting is verkregen, voor elk 
teken gereduceerd wordt tot minder dan 4 bits, om het in te 
delen in één der tien mogelijke klassen 0 … 9. Het eerste deel 
van het toegepaste reductieproces verloopt in een aantal opeen- 
volgende trappen. Opgemerkt zij dat de reductiefactor per trap 
3 à 4 bedraagt. zodat telkens 4 à 4 van de informatie naar een 
volgende fase wordt doorgegeven. Hierbij doet zich uiteraard 
het probleem voor welke informatie moet worden verwijderd 
en welke behouden moet blijven om het resultaat minder ‘re- 
dundant’ en dus betrouwbaarder te maken. Het onderzoek 
heeft geleid tot het realiseren van een lees-sorteermachine voor 
brieven. Een brief met de daarop voorgedrukte schrijfvakjes 
wordt met behulp van een televisiecamera afgetast. Het ver- 
kregen video-signaal wordt gekwantiseerd, d.w.z. in amplitude 
begrensd, waardoor slechts de twee waarden wit en zwart aan- 
wezig blijven. Voorts vindt er een tijdkwantisering plaats. Elk 
schrijfvakje wordt ontleed in 50 «< 35 beeldelementen. Bij de 
aftasting worden twee televisiecamera's gebruikt. Bij de ene 
camera veroorzaken zowel de rode schrijfvakjes als de geschre- 
ven cijfers signalen in het video-signaal. Door het toepassen 
van een optisch filter bij de andere camera bevat het video- 
signaal alleen de informatie der geschreven cijfers. In het geval 
dat de cijfers te groot zijn of te dicht bij elkaar zijn geschreven, 
kan met de aldus verkregen informatie de scheiding of segmen- 
tatie der cijfers tot stand worden gebracht. Als de hoogte van 
een geschreven cijfer een bepaalde waarde te boven gaat, wor- 
den de afmetingen van het cijfer gereduceerd. Voorts vindt er 
een verdunningsproces plaats, waardoor bij dik geschreven 
cijfers slechts het skelet van het cijferbeeld overblijft. Het resul- 
taat van de hier geschetste voorbewerkingen normeren en ver- 
dunnen is, dat elk cyferpatroon uiteindelijk in een rechthoek 
van 32 «» 32 beeldelementen past. De informatie wordt in een 
buffergeheugen geregistreerd en neemt daar 32 woorden of 
geheugenplaatsen in beslag. 

De detectie van karakteristieke eigenschappen verloopt in 
een aantal deelprocessen. Elk veld van 32 x= 32 beeldelementen 
wordt in 16 horizontale stroken afgetast met een submatrix 
van 3 » 3 bits. Van de 2” mogelijkheden binnen de submatrix 
worden er 7 gebruikt, en wel, om de stand van het lijnstuk in 
de submatrix in codevorm vast te leggen. Na het aftasten van 
het gehele beeldveld is voor elk der 16 zones een lijst van 32 
waarnemingen aanwezig. In het dan volgende deelproces wordt 
elke lijst van 32 waarnemingen omgevormd tot een zgn. ‘hori- 
zontal feature’. Wanneer bijvoorbeeld bij het van links naar 
rechts opschuiven van de submatrix voor de helling van de lijn 
achtereenvolgens wordt gevonden: ‘positieve helling, aanslui- 
tend horizontaal gedeelte, negatieve helling’, dan wordt de 
‘horizontal feature’ aangegeven als een bolle kromming. Er 
worden in totaal 19 verschillende ‘horizontal features’ gehan- 
teerd; zo kent men bijvoorbeeld ook horizontale en verticale 
lijndelen, parallel verlopende lijnen, enz. Wanneer de lijst van 
16 ‘horizontal features’ is verkregen, volgt het eigenlijke her- 
kenningsproces. Dit bestaat uit het volgtijdelijk vergelijken van 
de kenmerken van een gelezen cijferpatroon met een aantal 
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tabellen die in een afzonderlijk kernengeheugen in het geheu- 
gen van de machine zijn opgeslagen. Deze tabellen zijn in feite 
beslissingsnetwerken. Elk netwerk wordt op grond van een 
gevonden kenmerk in een hogere-orde toestand gebracht. Bij 
elke toestand is gespecificeerd hoe het netwerk in een volgende 
toestand kan geraken. Past de reeks van kenmerken van een 
cijferpatroon bij een bepaalde tabel, dan zal na afloop van het 
volgtijdelijk vergelijken het bijbehorende beslissingsnetwerk in 
de eindtoestand geraken, die aangeeft dat het cijferpatroon is 
herkend. De leesmachine bevat ongeveer 70 diagrammen of 
netwerken. Met elk diagram kan een klasse der in de praktijk 
voorkomende cijfervormen herkend worden. Er zijn ongeveer 
3500 machinewoorden van elk 32 bits nodig voor het vast- 
leggen van alle diagrammen. 

Bij het afwerken van het herkenningsproces wordt de bij de 
attasting verkregen lijst van eigenschappen vergeleken met alle 
toestandsdiagrammen. Wanneer in een toestandsdiagram de 
volgende eigenschap onjuist is, wordt voor het betreffende toe- 
standsdiagram een strafpunt genoteerd. Als bij het einde blijkt 
dat meer dan één toestandsdiagram volledig werd doorlopen, 
wordt als geldig teken dàt gekozen, waarbij het aantal opge- 
lopen strafpunten het geringste is. Omdat volgens deze methode 
zeer veel wegen doorlopen kunnen worden. kunnen ook zeer 
veel met de hand geschreven cijfers voorkomende variaties her- 
kend worden. Er zijn ongeveer 10* geldige mogelijkheden, het- 
geen betekent dat langs gemiddeld 1000 verschillende wegen 
een eindresultaat bereikt kan worden. 

Door de gehele machine uit te voeren als een ‘special purpose’ 
computer, waarbij veel bewerkingen in afzonderlijk daarvoor 
ontworpen elektrische circuits uitgevoerd worden, werd on- 
danks de gecompliceerdheid van het systeem een redelijk korte 
verwerkingstijd bereikt. De tijd benodigd voor het herkennen 
van één cijfer bedraagt 2 à 3 ms, 

De praktische resultaten, bereikt bij het op grond van de 
met de hand geschreven postnummers. sorteren van brieven 
zijn dat ca. /0%, van de toegevoerde brieven uitgesorteerd 
wordt en dat bij 30%, van de brieven één of meer cijfers niet 
herkend kunnen worden. Verder blijkt dat van de uitgesor- 
teerde brieven ca. 2% in verkeerde sorteervakken terecht komt. 
Vergeleken bij handbedrijf waar men ook met 1 à 2°/ mis- 
sorteringen rekening houdt, 1s dit niet slecht te noemen. 


5. Het onderzoekingswerk in Nederland 


In verschillende mstituten in Nederland worden onderzoekin- 
gen verricht naar de mogelijkheden om met de hand geschreven 
cijfers automatisch te lezen. Bij het Dr. Neher-Laboratorium 
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Fig. 10. Voorbeelden van schrijfruimten. 
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van PTT wordt gewerkt aan een leessysteem, waarmee men de 
verwerking van met de hand geschreven giro-opdrachten hoopt 
te kunnen automatiseren. Het project kan in een aantal delen 
worden gesplitst: 


a. Her onderzoek nuur een geschikte vorm en indeling van ven 
girokaart, met name van de schrijfvakjes, zodat deze kaart voor 
gebruik door een groot publiek acceptabel is. In fig. 10 zijn 
enige mogelijkheden getekend. Een punt van onderzoek is nog, 
in hoeverre de vorm en afmetingen van de schrijfvakjes invloed 
hebben op de duidelijkheid van het schrijven. 


b. Het ontwikkelen van een uftastinrichting, waarmee de docu- 
menten kunnen worden afgetast en waarmee de verkregen infor- 
matie naar een processor overgebracht kan worden. Er wordt 
hierbij gebruik gemaakt van een televisiecamera met een plum- 
bicon-buis. Elk schrijfvakje van een kaart wordt ontleed in 
32 » 32 beeldelementen. De inrichting bevat een drempel- 
schakeling voor het beslissen ot een beeldelement wit of zwart 
is, zodat bij aftasting per schrijfvakje 1024 bits ontstaan. 

In de proefopstelling, zoals die thans is gerealiseerd, worden 
de coördinaten gevormd van die punten waar een contrast- 
overgang optreedt; dit zijn dus de overgangen van wit naar 
zwart en van zwart naar wit. Wanneer een contrastovergang 
wordt waargenomen. worden de bijbehorende coördinaten van 
dat punt in de processor opgenomen. Bij de aftasting ontstaat 
zodoende een lijst met getallen, die corresponderen met de con- 
touren van een cijferafbeelding. De informatie-overdracht van 
de gegevens van alle schrijfvakjes op een kaart naar de pro- 
cessor vindt plaats binnen de tijd van één raster. dus binnen 
20 ms. Er kunnen in één raster maximaal 16 schrijfvakjes af- 
gelast worden, hetgeen betekent dat ruim 16000 bits binnen 
de tijd van 20 ms overgebracht worden naar de processor. 


c. Her bestuderen van herkenningssvstemen op in de praktijk 
verkregen cijfermateriaal. Vanwege het zeer experimentele sta- 
dium waarin alles nog verkeert, zullen de herkenningssystemen 
uitsluitend programmatisch met behulp van de processor wor- 
den beproefd. Er zijn thans enige herkenningsprogramma’s in 
onderzoek, waarbij kenmerken gehanteerd worden zoals samen- 
vloetingen van lijnen, horizontale en verticale lijndelen. gebogen 
lijnen, enz. Het zijn deterministische herkenningssystermen, 
waarin een aantal controlevoorwaarden is ingebouwd. 


In het algemeen wordt door onderzoekers op het gebied van 
de herkenningsproblematiek van met de hand geschreven cijfers 
de noodzaak gevoeld tot het aanleggen van een verzameling 
van geschreven cijfers, die dan als referentie zou dienen om 
de eigenschappen der verschillende herkenningssystemen onder- 
ling te kunnen vergelijken. In Amerika bestaan reeds enkele van 
deze zgn. ‘reference sets’. 
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Fig. IL. Enige voorbeelden van voor enkele landen karakteristieke 
schrijfwijzen. 
B OKTOBER 14/1 
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Er dient opgemerkt te worden dat vele van de karakteristieke 
kenmerken van het geschreven schrift van land tot land nogal 
verschillen. Enige bijzonderheden: de wijze waarop men door- 
gaans in Nederland het cijfer 8 schrijft en zoals het ook op de 
scholen wordt aangeleerd, is bepaald uniek te noemen. Elders. 
zelfs in de ons omliggende landen, wordt het cijfer anders 
gevormd (fig. 11). In deze figuur zijn nog andere voorbeelden 
opgenomen van karakteristieke schrijfwijzen; zo is aangegeven 
op welke wijze o.a. in Duitsland veelal het cijfer | wordt ge- 
schreven. De vorm van het geschreven cijfer 5 volgens fig. || 
treft men vaak in het Japanse handschrift aan. 

Om de resultaten die de verschillende onderzoekers bereiken 
te kunnen vergelijken en om vast te stellen in welke mate de 
verschillende systemen geschikt zijn voor het herkennen van 
de Nederlandse schrijfwijze. is het gewenst een afzonderlijke 
Nederlandse referentieverzameling te vormen. Aan een derge- 
lijke verzameling en aan de wijze waarop deze wordt samen- 
gesteld moet een aantal eisen gesteld worden. Wanneer men 
een enigszins getrouw beeld wil vormen van de oorspronkelijke 
optische informatie, dan zouden de volgende punten over- 
wogen dienen te worden : 

e De keuze van het aantal beeldpunten moet voldoende groot 
zijn. opdat de door kwantisering veroorzaakte vervorming 
gering blijft. 

e De technische eigenschappen van de aftaster waarmee de 
informatie verkregen werd, moeten bekend zijn. Hierbij kan 
men denken aan de spectrale gevoeligheid van de optisch- 
elektrische omzetter zowel als aan de spectrale energieverdeling 
van de lichtbron. Voorts zou het gewenst zijn als er een lineair 
verband zou bestaan tussen de intensiteit van het op de aftaster 
vallende licht en het elektrische signaal, dat door de aftaster 
wordt afgegeven. 


e De waarde van de reflectiecoëfficiënt van elk beeldpunt, de 


grijstrap. moet eveneens in gecodeerde waarde opgegeven wor- 
den. Dit laatste is gewenst om elk teken als een driedimensio- 
nale figuur te kunnen beschouwen, waarbij in de Z-richting de 
zwartingsgraad aangegeven wordt. Wanneer slechts binaire in- 
formatie verstrekt zou worden, is één doorsnede van het teken 
gemaakt en zou men een resultaat verkrijgen dat afhankelijk 1s 
van de werking van een zwart-wit discriminatorschakeling. 

e De referentieverzameling dient representatief te zijn. Men 
mag aannemen dat giro-opdrachten en bankoverschrijvingen in 
het algemeen vrij duidelijk en zorgvuldig geschreven zijn. De 
numerieke gegevens die op dit soort documenten geschreven 
zijn zullen wellicht een ander beeld geven dan geheel wille 
keurig geschreven cijfers. 


Tenslotte zij opgemerkt dat het in een later stadium wellicht 
nuttig kan blijken om verschillende referentieverzamelingen te 
vormen. welke elk afzonderlijk representatief zijn voor een cate- 
gorie van personen die onder hepaalde omstandigheden hun 
gegevens verstrekken 
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IV. De ontwikkeling van een optische lees- en sorteermachine 


door ir. H. van Steenis en ir. A. Kempkes, 1BM-Laboratonum, Uithoorn 


Synopsis: Development of an Optical Reader Sorter. 

The IBM 1275 Optical Reader Sorter was designed to read numerals 
and symbols of either the OCR-A or the OCR-B type font, allowing 
for wide print quality tolerances. 

At first a brief discussion is given im this article of the environment 
far the reader and the consequence for its design. Then the concept 
and philosophy for the two-dimensional Integrating recognition logic 
are treated more in detail. Finally a short deseription is given ol the 
computer simulation and the techniques used. 


1. Inleiding 


De snelle toeneming van het aantal financiële transacties, ver- 
oorzaakt door een in voortdurende groet verkerende economie. 
heeft de banken en andere financiële instellingen ertoe gedwon- 
gen uit te zien naar een wijze waarop de behandeling van 
cheques en overschrijvingen kan worden geautomatiseerd. Voor 
dit doel is ongeveer tien jaar geleden een leessysteem ontwik- 
keld voor magnetusch schrift (MICR Magnetic Ink Char- 
acter Recognition). 
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In de Verenigde Staten werd het E-13B schrift ontwikkeld en 
in Europa het CMC-7 schrift. Beide schriftsoorten eisen speciale 
kostbare drukapparatuur en een hoge mate van controle op 
de drukkwaliteit. 


In Europa — waar in tegenstelling tot de Verenigde Staten het 
lezen van magnetisch schrift weinig wordt toegepast — is een 
sterke neiging merkbaar om over te gaan tot het optisch lezen 
van cheques en overschrijvingen (OCR Optical Character 
Recognition). Het hoofdmotief hiervoor is dat snelle regel- 
drukkers kunnen worden gebruikt voor het prepareren van de 
formulieren zodat kostbare drukapparatuur. noodzakelijk bij 
magnetisch lezen. kan worden vermeden. De [BM-1275 opti- 
sche lees- en sorteermachine werd tegen deze achtergrond ont- 
wikkeld. 


2. Eisen 


De volgende eisen werden gesteld vanuit het toepassingsgebied 
van de optische lezer. 
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ISO -B 
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Fig. 1. Afbeelding van de beide beschikbare schriftsoorten: 1SO-A 
en [SO-B 


a. Schriftsaort 

De optische lezer moet in staat zijn een algemeen aanvaarde 
schriftsoort te lezen, zodat formulieren tussen de diverse finan- 
ciële instellingen kunnen worden uitgewisseld. De keuze tus- 
sen [SO-A en [SO-B schrift (fig. 1) is aan de gebruiker over- 
gelaten (ISO International Standardizing Organization). 
Herkenningslogica is voor beide schriftsoorten ontwikkeld. 


b. Leessnelheid 

Een hoge leessnelheid is een vereiste. Een zeer groot aantal 
formulieren moet per dag kunnen worden gelezen. Bovendien 
moeten de formulieren worden gesorteerd, wat meer dan één 
sorteergang door de machine met zich meebrengt. 

In het algemeen wordt de te lezen informatie in éên regel 
samengebracht, die in één gang door de optische lezer kan 
worden gelezen. De transportsnelheid van de formulieren be- 
draagt 6,7 m/s. 


c. Leesprestaties 

De doorvoersnelheid van de optische lezer is maximaal 96 000 
formulieren van vijftien centimeter lengte per uur. In het geval 
dat van elk formulier dertig tekens (cijfers en speciale sym- 
bolen) moeten worden gelezen, komt dit neer op ongeveer 
drie miljoen gelezen tekens per uur, ofwel — 800 tekens per 
seconde. De leesprestaties van de lezer moeten dus zeer goed 
zijn. om het aantal leesfouten per tijdseenheid te beperken. 


d. Drukkwaliteit 

Een grote variëteit aan drukmachines en het feit dat de formu- 
heren ontstaan in verschillende locaties, maakt het waarschijn- 
lijk dat er weinig controle kan zijn op de drukkwaliteit. Om 


Fig. 2. De IBM-1275 optische lees- en sorteermachine. 
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die reden moest er een nauwkeurig herkenningssysteem wor- 
den ontworpen, zodat ook druk van minder goede kwaliteit 
kan worden gelezen. Met deze eisen als uitgangspunt werd het 
[BM-1275 herkenningssysteem [Il] ontwikkeld en gekoppeld 
aan het transportsysteem van de IBM-1419 magnetische lees- 
en sorteermachine. De volledige IBM-1275 is afgebeeld in fig. 2. 

Het compartiment aan de linkerzijde bevat de herkennings- 
logica. Formulieren worden aan de rechterzijde in de machine 
gebracht. Het optisch aftasten vindt plaats in het ernaast ge- 
legen deel. In het middengedeelte van de machine zijn twaalf 
aflegvakken zichtbaar, die worden gebruikt tijdens het lezen 
of sorteren, een dertiende aflegvak is voor de afgewezen for- 
mulieren. Door middel van schakelaars boven de aflegvakken 
kan de operator de gewenste functie selecteren. 


3. Lees- en herkenningssysteem 


In het lees- en herkenningssysteem van [BM-1275 kan men 
zes basiselementen onderkennen (fig. 3). De leeskop zet varia- 
ties in het gereflecteerde licht om in elektrische signalen. De 
leesversterkers versterken deze signalen. De versterkte signalen 
worden hierna via een drempelcircuit gedigitaliseerd in zwarte 
en witte rasterpunten. In de matrix worden de rasterpunten 
verzameld ten einde een elektronisch beeld op te bouwen van 
dat gedeelte van het formulier, dat net is afgetast. 

De vergelijkingslogica analyseert voortdurend het elektro- 
nische beeld en bepaalt op het juiste tijdstip de mate van gelij- 
kenis tussen dit elektronische beeld van een teken en elk van 
de tekenklassen die kunnen worden herkend. De beslissings- 
logica ten slotte inspecteert de uitkomst van de vergelijkingen 
en besluit of het teken moet worden afgewezen dan wel is her- 
kend. In het laatste geval wordt het teken geïdentificeerd. 

Elk van deze basiselementen zal nu meer in detail worden 
behandeld. 


àl. De leeskop 


Van groot belang voor de herkenningsprestaties is de resolutie 
(het oplossend vermogen) van de leeskop. De resolutie bepaalt 
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Fig. 3. Schema van het [BMA 275 lees- en herkenningssysteem. 


het kleinste detail dat nog kan worden waargenomen. Op 
grond van ervaringen met voorgaande leessystemen is gekozen 
voor een resolutie van 0,127 mm. Een elementaire cel m de 
matrix representeert derhalve een gebiedje van 0,127 bij 0,127 
mm. De samenstelling van de optische aftaster is conventioneel : 


jade inj 


Fig. 4. Gedrukte tekens en de resulterende matrixpatronen (de duur 
van de vergelijkingsperiode is weergegeven onder de figuren). 
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twee wolframlampen verlichten dat gedeelte van het formulier, 
dat zich juist onder de leeskop bevindt; met behulp van een 
lens wordt op een rij van 82 fotodiodes een | :1 afbeelding 
gevormd van het af te tasten gebied. 

De steek van twee aangrenzende fotodiodes is gelijk aan de 
eerder genoemde 0,127 mm. Van deze rij fotodiodes vormen de 
binnenste 72 fotodiodes het gebied dat het te lezen teken moet 
passeren, de zgn. leesband. Deze band is ongeveer driemaal de 
hoogte van een teken ten einde praktische druk- en snijtoleran- 
ties te kunnen toelaten. 

De tien resterende fotodiodes, vijf aan de onderzijde en vijf 
aan de bovenzijde, worden gebruikt om onregelmatigheden 
zoals annuleringsstempels of scheef gedrukte regels te detec- 
teren. 

Een voordeel van de combinatie silicium fotocel/wolframlamp 
is dat de spectrale gevoeligheid der cel in het nabije infrarood 
ligt, zodat de leeskop blind is voor lichtgekleurde achtergrond- 
bedrukking, maar wel gevoelig blijft voor bepaalde inkten, toe- 
gepast in de gebruikte linten. Zie als voorbeeld fig. 4a, waarin 
de afdruk van een bruin stempel is weergegeven. 


3.2. De leesversterkers 


Elke fotodiode is verbonden met een eigen logaritmische ver- 
sterker. De belangrijkste eigenschap van een logaritmische ver- 
sterker is dat de verandering van de uitgangsspanning uitslut- 
tend afhankelijk is van de afgetaste contrastverandering en on- 
afhankelijk van de verlichtingssterkte en de gevoeligheid van de 
fotodiades. Door het ‘witniveau’ van iedere leesversterker op 
een bepaalde waarde vast te leggen kan een zeer goede unifor- 
miteit in signaal van de leeskanalen onderling worden bereikt. 


3.3, Het drempelcircuit 


Het signaal van iedere versterker wordt vergeleken met een 
dynamische drempelspanning en wordt afhankelijk van de pola- 
riteit van het resultaat als zwart of wit beoordeeld. De dyna- 
mische drempelspanning moet op een correcte wijze worden 
bepaald ten einde een zo natuurgetrouw mogelijk beeld van het 
gedrukte teken te verkrijgen. 

Er zijn drie factoren, die de drempelspanning van een lees- 
kanaal beïnvloeden. De drempelspanning kan niet beneden een 
bepaald niveau dalen (de minimumdrempel); dit om te voor- 
komen dat onregelmatigheden in het papier worden geïnter- 
preteerd als een zwart/wit-patroon. De drempelspanning wordt 
beïnvloed door het gedetecteerde contrast in nabij gelegen lees- 
kanalen. De beïnvloeding is zwakker naarmate de afstand tot 
het leeskanaal groter is. Tenslotte beïnvloedt het sterkste zwart- 
signaal, gedetecteerd in de rij fotodiodes, de drempelspanning. 
De gewenste mate van beïnvloeding is experimenteel bepaald. 

De resultaten, bereikt met dit systeem, zijn weergegeven in 
fig. 4 (b, c‚, den e). De afgedrukte tekens in fig. 4e zijn moeilijk 
goed te reproduceren, de zwarting van de tekens is juist onder 
de gestelde grens. 

De uitgangsspanning van elk leeskanaal — welke binair is in 
amplitude en continu in tijd — wordt elke 19 ps bemonsterd. Dit 
komt neer op een bemonstering van elke 0,127 mm op het 
formulier. 

Het resultaat van een bemonstering is een kolom van 72 
binaire rasterpunten. De informatie in de kolom wordt bit voor 
bit naar de matrix gestuurd. Elke bit stelt een gebiedje voor 
van 0,127 bij 0,127 mm op het papier; door strooting en derge- 
lijke zal het werkelijke gebiedje iets groter zijn. 
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34. De matrix 


Bits afkomstig van de leeskanalen worden continu verzameld 
in de matrix, waar een elektronisch beeld wordt gevormd van 
de 2,5 mm die zojuist is afgetast. De matrix is een 720 bits lang 
schuifregister (klokfrequentie ongeveer 1 900 000 Hz), dat het te 
herkennen patroon in alle mogelijke posities brengt. 

Het 720-bits schuifregister kan worden voorgesteld door 20 
kolommen, corresponderend met evenzoveel bemonsteringen 
over 2,54 mm met een hoogte van 36 bits, de helft van het aan- 
tal fotodiodes, Omdat een teken slechts eenderde van de hoogte 
van de fotodiode-rij kan beslaan, wordt het bitpatroon van de 
bovenste 36 fotodiodes gesuperponeerd op het bitpatroon van 
de onderste 36 fotodiodes. 


3.5. De vergelijkingslogica 


Verbonden met de matrix is een aantal elektronische maskers 
— voor elke te herkennen teken-klasse ongeveer vijf — die kun- 
nen worden vergeleken met het bitpatroon in de matrix, af- 
komstig van het juist afgetaste teken. Deze vergelijking dient 
slechts dan plaats te vinden wanneer het bitpatroon ongeveer 
goed gepositioneerd is ten opzichte van de maskers. 

Een speciale poortschakeling maakt alleen dan vergelijking 
mogelijk wanneer de waarschijnlijkheid van een goede posi- 
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tionering maximaal is. De goede werking van deze poort- 
schakeling is van het hoogste belang. De schakeling mag niet 
reageren op kleine vlekken afkomstig van stof of vuil op het 
formulier, maar moet wel in alle gevallen aanspreken op smalle 
tekens met eventueel missende delen. Het feit dat de breedte 
van de tekens varieert, dat een deel van de tekens slechts gedeel- 
telijk is afgedrukt en dat de afstand tussen de tekens onderling 
sterk kan variëren (fig. 4f) maakt de poortschakeling complex: 
op details van deze schakeling zal hier niet worden ingegaan. 
Het begin van de vergelijkingsperiode wordt bepaald door 
de afstand tot het voorgaande teken en door de minimum- 
voorwaarden, gesteld aan een patroon. De duur van de verge- 
lijkingsperiode wordt bepaald door de breedte van het teken 
en de afstand tot het volgende teken. Afhankelijk van de breedte 
van het teken verplaatst het bitpatroon zich in de vergelijkings- 
periode over 6 … 13 kolommen. Ter vergelijking: de nominale 
breedte van een teken is 14 kolommen, de nominale breedte 
van de witte ruimte tussen 2 tekens is 6 kolommen. 
Gedurende de vergelijkingsperiode, dit is gemiddeld gedu- 
rende 9 » 36 — 324 klokpulsen, wordt het bitpatroon vergele- 
ken met de elektronische maskers. Het aantal malen dat ten- 
minste één van de maskers aanspreekt op het bitpatroon wordt 
geteld, om aan het einde van de vergelijkingsperiode een beslis- 
sing mogelijk te maken over de identiteit van het afgetaste 
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Fig. 5. Twee mogelijke maskers voor een “2 in het ISO-A schrift. Links: masker voor een “12°, waarvan de onder- 
zijde kan ontbreken. Rechts: masker voor een '2', waarvan de bovenzijde voor een groot deel kan ontbreken. 


Legende: | = matrixpositie moet zwart zijn 
OD =— matrixpositie moet wit zijn 
Di = 
voldoen 
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tenminste één van de door de lijn verbonden matrixposities moet aan de aangegeven conditie 
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teken. Het doel van elk masker is zo vaak als mogelijk aan 
te spreken op de juiste patronen. Overeenstemming tussen het 
masker en patronen van andere tekenklassen dient zoveel mo- 
gelijk te worden vermeden. 


Tijdens de ontwikkeling van de maskers is het aantrekkelijk 
gebleken voor elke teken-klasse een aantal alternatieve maskers 
te gebruiken. In het algemeen zijn er 5 maskers voor elke te 
herkennen teken-klasse ontworpen, nl. voor patronen zonder 
linkerzijde, zonder rechterzijde, zonder bovenzijde en voor 
patronen met een grote streepdikte. In fig. 5 zijn 2 mogelijke 
maskers voor de *2’ van het ISO-A schrift weergegeven. Geble- 
ken is dat de op op een dergelijke wijze vastgelegde maskers 
voldoende vrijheid bieden om problemen op te lossen. 


3.6. Beslissingslogica 


Tijdens de vergelijkingsperiode wordt het aantal malen, dat 
tenminste één van de maskers aanspreekt op het bitpatroon, 
geteld; er is één teller per teken-klasse (dus in totaal zijn er 14 
tellers). Aan het einde van de vergelijkingsperiode worden de 
tellers geïnspecteerd en wordt de beslissing genomen het teken 
te identificeren dan wel af te wijzen. 


De tellingen moeten aan twee criteria voldoen wil het juist 


afgetaste teken positief geïdentificeerd worden: 


|. De hoogste telling moet een zekere waarde overschrijden; 
in ons geval is deze waarde 4. 


hd 


Het verschil tussen de hoogste telling en de op &én na hooe- 
ste telling moet ook een zekere waarde overschrijden, in 
ons geval eveneens 4. In principe kunnen deze waarden ver- 
schillend zijn. 


Als aan beide criteria is voldaan, geeft die teller, die de hoog- 
ste telling bevat, de teken-klasse aan die herkend is. Het patroon 
wordt afgewezen als aan één van beide criteria niet is voldaan. 
In het laatste geval kan nog onderscheid worden gemaakt tus- 
sen een conflict (l, maar niet 2) en een zuivere afwijzing (niet 
|). Tellingen (tussen haakjes) en beslissingen op een aantal 
patronen zijn weergegeven in fig. 6. 


3.7. Het herkenninessysteem 


Ten einde de eigenschappen van het besproken herkennings- 
systeem beter te kunnen waarderen, is een vergelijking met het 
conventionele matrix-herkenningssysteem nuttig. In deze con- 
ventionele systemen (bijv. de IBM-1418 en de IBM-1428 lees- 
en sorteermachines [2, 4|} is een eenmalige overeenstemming 
tussen het bitpatroon en een masker voldoende voor een her- 
kenning. Indien twee maskers aanspreken op hetzelfde patroon 
ontstaat een conflict en het patroon moet worden afgewezen. 

Een eerste stap tot de verbetering van het conventionele sys- 
teem is het toevoegen van tellers, waarmee het aantal overeen- 
stemmingen tussen het patroon en de verschillende maskers 
kan worden geteld. Omdat de elektronische maskers niet zijn 
gewijzigd, zal in het beste geval een aantal van de conflicten 
kunnen worden opgelost, Inderdaad bleek, dat op deze manier 
80° van de op de IBM-1418 optredende conflicten kon wor- 
den opgelost zonder dat er herkenningsfouten ontstonden. 

De tweede stap ter verbetering is een andere doelstelling bij 
het ontwerpen van de maskers. In plaats van exclusieve mas- 
kers, die uitsluitend aanspreken op de juiste patronen, moeten 
nu maskers worden ontwikkeld, die zo vaak mogelijk aanspre- 
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Fig. 6. Verschillende patronen van het teken ‘2’ ([SO-B schrift) samen 
met de resulterende tellingen en beslissingen. 


ken op de juiste patronen en zo min mogelijk op patronen van 
andere teken-klassen. Dit betekent een aanzienlijke vereen- 
voudiging van dat deel van de maskers, dat moet voorkomen 
dat onjuiste patronen aanspreken. 


Een bijkomend voordeel van de beslissing op grond van tel- 
lingen is-dat de verhouding tussen afwijzingen en substituties 
kan worden gevarieerd zonder dat de elektronische maskers 
behoeven te worden veranderd. Indien de beide teleriteria wor- 
den verhoogd, neemt het aantal substituties af en het aantal 
afwijzingen toe. Verlaging van de telcriteria veroorzaakt het 
omgekeerde. Het optimale teleriterium voor de 1275 werd vast- 
gesteld met het oog op de verhouding tussen de kosten van het 
corrigeren van een substitutie en een afwijzing. 


De met het besproken herkenningssysteem behaalde resultaten 
zijn zeer goed. Het is onmogelijk om deze resultaten in getallen 
weer te geven zonder daarbij zeer nauwkeurig de drukkwahiteit 
en de kwaliteit van de formulieren te specificeren. Onder actuele 
omstandigheden is de drukkwaliteit niet meer alleen de door- 
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slaggevende factor voor de leesprestaties van het systeem. Met 
andere woorden: papierdefecten, stempels en incorrecte posi- 
tionering van de bedrukking op het formulier kunnen in hoge 
mate de leesprestaties beinvloeden. 


4. Het instrumentatiesysteem 


De ontwikkeling van de herkenningslogica zou onmogelijk zijn 
geweest zonder een goed instrumentatiesysteem: dit geldt te 
meer wanneer de drukkwaliteit op de te lezen formulieren zo 
sterk kan variëren als dit het geval kan zijn bij de 1275. Tijdens 
de ontwikkeling is een instrumentatiesysteem toegepast dat 
analoog Is aan dat wat wordt gebruikt voor de IBM-1975 
paginalezer, ontwikkeld voor de administratie van de sociale 
verzekering in de Verenigde Staten [3]. 

Het uiteindelijke ontwerp voor de elektronische maskers 
werd bereikt via een iteratief optimaliseringsproces onder con- 
trole van de ontwerper. Zijn hulpmiddelen daarbij waren een 
computer, een complete TBM-1275 lezer en een verzameling 
programmas. 

Tijdens de beginfase van de ontwikkeling is het aantal tekens. 
dat moet worden getest, nog gering. Zodra de maskers ver- 
Aynder en intelligenter worden, groeit dit aantal al snel tot 
enkele miljoenen. De efficiency en de nauwkeurigheid van het 
nstrumentatiesysteem zijn dan van vitaal belang. 


Een computer — een Systeem/360 Model 40 met een 256k ge- 
heugen — is het hart van het instrumentatiesysteem. Hiermee 
verbonden is een complete 1275 optische lezer, voorzien van 
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een speciale aanpassingseenheid, die de computer rechtstreeks 
verbindt met verschillende delen van de herkenningslogica. Via 
deze eenheid kunnen matrixpatronen samen met gegevens over 
de herkenning — zoals de tellingen — naar de computer worden 
gezonden ten einde daar op magneetbanden te worden vast- 
gelegd. Naast dit instrumentarium is een aantal programma’s 
ontwikkeld, bijv. om statistische gegevens te verkrijgen, om 
matrixpatronen te rangschikken en om herkenningslogica te 
controleren. Een herkennings-simulatieprogramma, waarin de 
herkenning zich exact gedraagt als in de IBM-1275 lezer, is 
een ander essentieel element van het instrumentatiesysteem. De 
elektronische maskers worden vertaald in Booleaanse logica 
en worden verponst aan het simulatieprogramma aangeboden. 

Het begin van een nieuwe iteratie is in alle gevallen: het 
lezen van een groot aantal formulieren door de 1275 (fig. 7). 
De 1275 1s dan voorzien van maskers volgens het laatste iteratie- 
niveau. De formulieren moeten zoveel mogelijk een represen- 
tatieve afspiegeling vormen van de variëteit aan formulieren, 
die onder normale omstandigheden optreedt. De formulieren 
worden gelezen, statistische gegevens worden verzameld en de 
patronen van niet-herkenbare tekens worden op magneetband 
‘geschreven’, gerangschikt en afgedrukt. De ontwerper van de 
maskers bestudeert de afgedrukte patronen en tellingen en 
tracht de maskers te verbeteren. Modificaties in de maskers 
worden verponst en met het herkennings-simulatieprogramma 
gesimuleerd, eerst op de zojuist verzamelde patronen, later ook 
op probleempatronen die eerder zijn verzameld. 

De maskers worden gemodificeerd en gesimuleerd totdat 
uiteindelijk een bevredigend masker is ontworpen. Deze mas- 
kers worden in de 1275 aangebracht. Met behulp van de ver- 
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Fig. 7. Het instrumentatie- 
systeem. gebruikt bij de ont- 
wikkeling van de herken- 
ningslogica. 


DE INGENIEUR JRG 83 NR 40 8 OKTOBER 1971 


ponste maskers, gebruikt bij de laatste simulatie, wordt een 
groot aantal testpatronen ontworpen, die kunnen worden ge- 
bruikt bij het foutenvrij maken van de zojuist in de 1275 aan- 
gebrachte maskers. Deze procedure versnelt het vinden en her- 
stellen van fouten enorm en verzekert dat de in de 1275 aan- 
gebrachte maskers identiek zijn aan de tijdens de laatste simu- 
latie gebruikte maskers. Zo nodig kan dan met een nieuwe 
iteratie worden begonnen. 


5. Slot 


Uitgaande van het programma van eisen, gesteld door het 
toepassingsgebied, is beschreven hoe het [BM-1[275 herkennings- 
programma is ontwikkeld, De nadruk 1s gelegd op het feit dat 
het leessysteem in staat moet zijn ook zeer slecht afgedrukte 
tekens te behandelen. 


Tot het goed functioneren van het leessysteem hebben de vol- 

gende factoren het meest bijgedragen : 

e Het zelfregelende leessysteem en de hoge resolutie in de 
matrix, beide noodzakelijk om ook zeer slechte druk nog 
correct te kunnen reproduceren. 


Korte technische berichten 


WARC-ST, 1971 


Van 7 juni … 17 juli 1971 werd in Genève een Wereld Admini- 
stratieve Radio Conferentie gehouden, welke beperkt was tot 
de satelliettelecommunicatie. Deze conferentie, belegd door de 
Internationale Telecommunicatie Unie, en gemakshalve aange- 
duid als WARC-ST, werd nodig geacht om bij de snelle ont- 
wikkeling van de telecommunicatie met en via satellieten de 
voorzieningen, getroffen in het radioreglement in 1963 betref- 
fende het gebruik van frequenties voor satellietetommunicatie, 
aan te passen en uit te breiden. 

De uitbreidingen hebben vnl. betrekking op het gebruik van 
het frequentiespectrum boven 10 GHz. In het gebied van 
40 GHz … 275 GHz werd een eerste verdeling gemaakt voor 
uitsluitend verbindingen met en via satellieten. De administra- 
tieve voorschriften, vnl. Artikel 7 (Regelingen voor de afzon- 
derlijke radiodiensten) en Artikel 9A (Natificeren van frequen- 
ties voor stations voor de satelliettelecommunicatie) en de bij- 
behorende technische criteria, werden op de nieuwe te voor- 
ziene situatie afgestemd. Veel aandacht werd besteed aan de 
maximaal toelaatbare uitgestraalde vermogens, omdat de mees- 
te diensten die van satellietcommunicatie gebruik maken, hun 
frequenties gezamenlijk, dan wel met aardse diensten zullen 
moeten delen. waarbij de onderlinge storing tot een aanvaard- 
baar minimum beperkt moet blijven. Ter voorbereiding van de 
technische ondergrond voor dit werk vond in februari 1971 
een ‘Special Joint Meeting’ plaats van de betreffende CCIR 
Studiecommissies. 

De frequentietabel van het radioreglement (Artikel 5) onder- 
ging een aantal wijzigingen, wat een verruiming van het fre- 
quentiegebruik voor satellietcommunicatie mogelijk maakt. 
Enige voorbeelden zijn: 

L. De hand van 1535 MHz … 1660 MHz: 
In dit frequentiegebied komen twee banden van 7,5 MHz breedte 
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e Het herkenningssysteem, dat geen exacte registratie van het 
patroon inrde matrix vereist en waarin de herkenning is ge- 
baseerd op de mate van overeenkomst tussen het patroon en 
de diverse elektronische maskers. 

e Het instrumentatiesysteem, dat is gebruikt tijdens de ont- 
wikkeling van de herkenningslogica. 


De “1275 optische lees- en sorteermachine werd ontwikkeld in 
samenwerking met de [BM-laboratoria in Rochester (Minne- 
sota) en Endicott (New York). 
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beschikbaar voor een maritiem mobiel satellieteomm uuicate- 
systeem, twee banden van 15 MHz breedte voor een soortgelijk 
aëronautisch systeem, en voor gemeenschappelijk gebruik door 
deze beide diensten twee banden ter breedte van | MHz. 


2. Voor omroep via satellieten (voor geluid en beeld): 
— de band van 616 MHz … 790 MHz voor incidentele toepas- 
singen, nadat door de betrokken landen hiervoor speciale over- 
eenkomsten zullen zijn gesloten: 

de band van 2500 MHz … 2690 MHz, vnl. voor gebruik 
buiten Europa: 
— de band van 11,7 GHz … 12,5 GHz. Deze zal met gelijke 
rechten tevens voor de aardse omroep, het radioverkeer tussen 
vaste punten en het mobiele radioverkeer beschikbaar zijn. 
waarbij verder internationaal overleg moet worden afgewacht 
voor de gedetailleerde bandindeling. 


3. Voor communicatiesatellietsystemen: 

Enige banden ter breedte van 250 MHz tussen 10,7 GHz en 
[4,5 GHz en twee banden van 3,5 GHz tussen 17,7 GHz en 
31 GHz. 


Opgemerkt zij nog, dat als nieuwe communicatiedienst werd 
gedefinieerd die van satellieten voor exploratie van de aarde. 
Hiervoor werd in het frequentiespectrum een plaats aangewezen. 

Voor de radio-astronomie werd een aantal nieuwe frequentie- 
bandjes vastgelegd. De waarde van het radio-astronomisch 
onderzoek werd onderkend in de vorm van een aantal voet- 
noten: de resultaten die behaald kunnen worden blijven echter 
in belangrijke mate afhankelijk van de mate, waarmee vrij- 
waring kan worden verkregen van de radiostoring, ondervon- 
den van andere radiocommunicatiediensten. 


De wijzigingen in het radioreglement werden door de ca. LOU 
vertegenwoordigde landen goedgekeurd. Zij zullen per | januari 
1973 in werking treden. 


Ir. F. R. Weubauer. 
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Elektromagnetische ontstoring en afscherming 


Een bijzondere aflevering van ‘Siemens Bauteile Informationen’, 
1970, 1s gewijd aan ontstoring en afscherming. Men treft er 
artikelen in aan over eigenschappen van ontstoringsmiddelen 
en de uitvoering van ontstoringsfilters, over een stoormeet- 
apparaat voor het frequentiegebied van 0,135 … 3 MHz en 
over afschermtechnieken. 

In één der artikelen, handelend over afschermtechnieken. 
wordt o.a. vermeld, dat men bij industrieel vervaardigde af- 
geschermde meetcabines boven 150 kHz een afschermdemping 
van S0 … 100 dB kan bereiken. Voor de afscherming wordt 
veelal koperfolie toegepast, terwijl ventilatieopeningen en ven- 
sters van een roosterconstructie zijn voorzien. De doorsnede 
van de mazen daarin bepaalt boven welke frequentie het roos- 
ter doorlatend wordt. 

De grootste tot nu toe door Siemens geleverde cabine heeft 
de afmetingen van 32.03 « 8,09 3,38 m. De bovengrens, 
waarbij deze ruimte nog de gewenste afschermende werking 
bezit, bedraagt 35 GHz. 


Boekennieuws 


WarDRON, R. A, Theory of guided electromagnetic waves, XVI 
SIS blz. Uitg: Van Nostrand Reinhold Company. London, 
1970. Prijs: £ 9,00, 


In dit boek worden problemen uit de theorie van de elektro- 
magnetische golfgeleiders behandeld. Dit gebeurt langs theo- 
retische weg en op een niveau dat de schrijver in zijn woord 
vooraf kenmerkt als liggend in het midden van het spectrum 
dat van een volledig praktische aan de ene kant tot een mathe- 
matisch geavanceerde behandeling aan de andere kant loopt. 


Met dit doel voor ogen heeft de schrijver een keuze uit het be- 
schikbare materiaal gedaan. die het beste geïllustreerd wordt 
door de titels van de hoofdstukken te vermelden: 1, The mathe- 
matics of waveguide theory, II. Basic electromagnetic theory. 
II. Transmission lines, IV. Elementary theory of waveguides, 
V. Cavity resonators, VL Perturbation theory and its applica- 
tons, VIL Inhomogeneous and anisotropie waveguides, VIII. 
Variation theory and its applications, IX. Non-uniform wave- 
guides. 

Vooropgesteld moet worden, dat het boek duidelijk is ge- 
schreven. De problemen worden helder geformuleerd: dikwijls 
wordt eerst de oplossingsmethode globaal doorgenomen en 
wordt daarna een tot in alle details complete afleiding van het 
resultaat gepresenteerd. Algemene resultaten van zuiver theo- 
retische aard blijven op de achtergrond (zo zal men bijv. reci- 
prociteitsstellingen en de beschrijving van de eigenschappen van 
een microgolfnetwerk met behulp van de verstroonngsmatrix 
niet aantreffen): de aandacht is vooral gericht op het langs 
theoretische weg analyseren van de eigenschappen van in de 
microgolftechniek concreet voorkomende configuraties. 

Een paar kritische opmerkingen dienen echter te worden ge- 
plaatst. Wat benamingen en notaties van de elektromagnetische 
grootheden betreft zijn er afwijkingen ten aanzien van de inter- 
nationaal aanvaarde. De elektrische (magnetische) fluxdicht- 
heid D(B) wordt door de schrijver elektrische (magnetische) 
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inductie genoemd; de elektrische ladingsdichtheid wordt aan- 
gegeven met q in plaats van p en de vector van Poynting met z 
mn plaats van met S. De recensent is verder van mening dat de 
hoofdstukken Ten |I zonder enig bezwaar weggelaten hadden 
kunnen worden, terwijl hoofdstuk [II aanmerkelijk korter had 
kunnen zijn. ledere lezer die in staat is de rest van het boek te 
bestuderen, zal met de stof van de eerste drie hoofdstukken 
ongetwijfeld vertrouwd zijn. 

Een belangrijk punt is, dat er in het boek iets misloopt bij 
de behandeling van de energiestroom in het elektromagnetische 
veld bij sinusvormig met de tijd veranderende velden. Het is 
gebruikelijk hierbij de zen. complexe vector van Poynting in 
te voeren, waarvan het reële deel in grootte en richting de waarde 
van de over een periode gemiddelde oppervlaktedichtheid van 
de vermogensstroom aangeeft. De schrijver weigert (blz. 125) 
deze complexe vector van Poynting te gebruiken. Dit heeft tot 
gevolg dat in de energiebeschouwingen nergens duidelijk is of 
de complexe tijdfactor van de complexe rekenwijze nu wel of 
niet in de formules is meegenomen en of de vergelijkingen op de 
reële veldgrootheden, dan wel op hun complexe veldvoorstel! 
lingen slaan. 

Een belangrijker rol spelen echter in het boek de veldbereke- 
ningen. De presentatie hiervan is uitstekend. Er zijn dan ook 
een aantal resultaten van de hand van de schrijver in het boek 
te vinden, die anders alleen in de vaktijdschriften te achterhalen 
zijn. 

Samenvattend kan worden gesteld, dat de hoofdstukken die 
veldberekeningen in golfgeleiderconfiguraties behandelen, een 
bijdrage tot de vakliteratuur in boekvorm zijn die zeker voor 
raadpleging in aanmerking komt, zowel door ingenieurs die in 
dit vakgebied werken, als door studenten die zich kennis van 
dit vakgebied eigen willen maken. 


Prof. dr. ir. A. T. de Hoop. 
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